华夏文化研习会吧 关注:1,813贴子:16,821
  • 2回复贴,共1

归来:是拯救,还是颠覆? 作诗机2017微信版公开测试!

只看楼主收藏回复

随着升级后的AlphaGo在围棋界所向披靡,人工智能与人类智慧的pk再次引发思考。
本来应该完全完善后再发布,但考虑到市面上已有IBM、中科院、厦门大学等机构在探索传统诗词的智能化项目。作为这一领域的鼻祖,久蛰不出,固非所宜。
“作诗机”的研发者、创始人经过慎重决定,舍弃APP模式,苦心孤诣,打造了基于微信的智能创作、超级词汇部分。旅游题壁及电视TV版本也在开发过程中。
在介绍新功能之前,我们做一点前情回顾:
1999——作诗机诞生于北京,为传统诗词智能化的全球首创。创始人是网络诗人林鸿程(当时网名叫稻香老农,住在北京稻香村)。
1999-2015——基于PC的作诗机产品,被下载四百多万次。
2015——另一位诗词高手裴涛加入,成为联合创始人,在武汉成立了稻香居科技,正式将这一专利产品公司化运作。
2015-2016——基于移动手机APP的产品,被下载近百万次,2016年下半年,每天日活达到2000人。
2017.3.11——本微信号测试性发布,每分钟收到数据请求500次。
18年来——基于Web和PC版的作诗机产品,被下载四百多万次。十八年来,已被使用超过2亿次。
分享几个小的例子,来说明它的功能:
1、从小到大,我们都知道李白是豪放的;杜甫是沉郁顿挫的;白居易“老太婆都听得懂,是通俗的”。老师们这样告诉我们,我们也这样告诉子女。可为什么呢?
李白:“我的常用词是:春风、黄金、万里、落日、美人……”
杜甫:“我的常用词为:风尘、白头、干戈、秋风、寂寞 ......”
白居易:“我的常用词为:不知、何处、不得、何人、何如......”
李白喜欢使用的词,潇洒辽阔,故其诗歌自然豪放;而杜甫喜欢用的词语则显得萧索寂寥,难怪其诗歌沉郁顿挫;而白居易的诗歌大量使用虚词,稀释了诗词的凝缩特性,所以通俗易懂。
通过常用词,来分析词性特点,从而归纳出作者风格。这是理性的大数据在感性的诗词领域小试牛刀。
2、又比如,把梁启超全集800万字导入作诗机小程序,会发现,“我们”一词,在他前半生的著作里,一次都没有出现过。相似的词,用的是“国民”。而后半生的著作里,出现了3291次。对于考察词汇的产生、语言的变迁、社会政治生活风气的变化非常重要。
3、看一首藏头诗:
黄鹤云间去,先随明月归。
生涯尤可羡,好梦过芳菲。
(藏头:黄先生好。作诗机出品)
其运算原理:基于大数据的断词算法、语境关联算法、遗传算法、神经网络算法等技术,对浩如烟海的古典文学“大数据”,进行收集、整理、提炼、组合。
本次发布内容介绍
本次发布分两部分,智能创作和超级词汇。
一、智能创作
分为写诗、填词、特种诗三个主要栏目
1、写诗
可以自动生成绝句、律诗(八句,有对仗),还可以跟配图,娱乐性更强一些。题目可以自拟,体裁可以自选。去掉了之前的韵部选择,也算是删繁就简罢。
2、填词
现在大约库里有一百多个词牌。
可按龙榆生《唐宋词格律》里整理的154个词牌自动填词。
3、特种诗
主要是藏头诗、嵌字诗。把你要说的话,嵌入到一首诗里去。比如乐视2015年骂小米王川的藏头诗,实在低级、庸俗,应该尝试用作诗机:准确而却很高雅。
注意:
藏头诗,一般只能四个字,或者八个字。原因很简单,诗一般是四句(绝句)或者八句(律诗)。
再就是有些字眼,组词较为困难。比如“裴涛你好”,古人诗词库大数据里,“裴”字是个姓,不好组词,“你”字也属于极不常见的,也不好组词。但“新春佳节”、“张云飞好”、“一生相依”这一类,就很好构词成句。
我们试一下自动作诗:荷花、菊花
荷花

菊花

说明:
菊:故园,登高,悲秋,萧萧……
荷:扁舟、流水、西湖、翠微……
虽然算不上极好的,但比起绝大多数诗词爱好者、研究者来说,恐怕已经远远超越了。
再来看看藏头诗
这是一种比较有趣的形式~
藏头:一生相依

藏头:中华万岁

藏头:遥贺新春

其中,“文豹”出自《列子》,表示有华丽斑纹的豹子,很珍贵,所以要藏起来。“蛰龙”出自《周易》,表示潜伏已久,即将飞腾。
作诗机是可以熟练用典故的。
1秒钟可以出10首。整首不满意,就继续点创作,直到出到满意为止。一首里面三句满意,一句不满意,可以一直点击候选替换,作诗机对每个句子提供无穷无尽的候选句。
版权?归你了!至少作为联合创始人,我听说过,有人用作诗机出版过诗集。
二、超级词汇
超级词汇是作诗机的另一大优势。
虽然这个栏目里堆砌了:词汇、韵书、词牌、写作。但最有用的,就是“词汇”。
后面写作可能会调入“个人”,韵书则扩充为“课堂”。总之,很多尚在建设中。
1、词汇
词汇的强大之处,在于你可以输入任意一个字、任意一个词,看看它的来龙去脉,看看它在诗词世界里的地位、用法、构词。
比如“波”~



首先,会告诉你,“波”字在古代属于常用字,虽然不是最常用,但排名靠前。
其次,古代经常走在这个字前面后面的,是哪些,比如风波、波浪、水波、沧波等。
再次,告诉你这个字在古代,属于哪个韵部,还有哪些字跟它是一个部门的。
再次,古人有哪些关于“波”字的名句,比如“烟波江上使人愁”……
再次,波字前面,一般跟两个什么样的字组成词;一般跟三个什么样的字组成词。波字后面,一般跟哪两个字、哪三个字……
还有,以波字开头的话,可以组成哪些三字、四字词。以波字结尾的话,可以有哪些三字、四字词。
我们再看看词,比如“荷花”

它会告诉你,这个词的热度怎么样?哪些词在它身边跟它走得最近,你最可能用得上。跟它对仗的是哪些词,有哪些关于荷花的名句等等….
这是一时兴起,即兴刷得一首七绝《荷花》:
绕郭田田一路香,摇光映日上纱窗。
浅波鱼戏翻新藻,入夜池心共雨凉。
这首小诗,用了“江南可采莲,莲叶何田田”的典故。摇光映日,将水波荡漾下,花光日影,描写得非常形象。
2、词牌
作诗机还提供手机上最方便的词牌查询,可以按名称关键字查询,也可以直接点击拼音首字木查询,还提取了词牌里最常用的20个字,直接点击就可以查询。




有了这个神器,初学者要在诗词大会上所向披靡,赢所有参赛者、主持人、评委,那不是轻轻松松,毫无压力么?
请关注微信公众号“作诗机”,升级还在继续。
我们要做真正意义上的文化与科技的融合;要做传统文化领域的大数据与人工智能;要完胜IBM和中科院;要对已经式微的传统诗词进行颠覆,亦是拯救。

ps:
如果同一时间使用的人数太多,服务器可能会出现短暂的卡死,正在升级服务器和优化算法,还请大家包涵~~~


IP属地:上海1楼2017-04-09 13:54回复
    机器是如何写出诗来得,作诗机算法分析~
    我们先看四首诗,这里面,两首是元稹的作品,两首是作诗机的作品。你能看得出来吗?
      七绝《清明》
      对镜空嗟白发新,微吟还唤梦中人。
      登楼入望青山旧,隔断红尘二十春。
      五律《清明》
      清明来向晚,山渌正光华。
      杨柳先飞絮,梧桐续放花。
      鴽声知化鼠,虹影指天涯。
      已识风云意,宁愁雨谷赊。
      七绝《寒食》
      今年寒食好风流,此日一家同出游。
      碧水青山无限思,莫将心道是涪州。
      五律《寒食》
      伤心曾失所,君子欲何归?
      瑶草诚难补,黄花孰可依。
      愁侵灯自照,老去叶初飞。
      世事同为客,青山对拂衣。
      笔者在17年前(2000年)在这里(诗词比兴)发布了第一代算法的作诗机产品。后因工作繁忙,也便没有更新。前年把自己退休了,看了一下日志,已经被使用超过2亿次。
      上面的其中两个作品是采用第二代算法的机器合成。我发布在公众号“作诗机”上。使用第三代算法的软件预计年内发布。
      我这里尽可能用最通俗的语言剖析一下作诗机的第二代算法。网上时常见到一些大学、科研机构研究的机器合成算法,写得很深奥,其实说白了,都差不多一个意思。
      总的来说,二代算法的作诗机写一首诗,经历了三个步骤:
      第一步、事先让机器学习约50万首律诗和绝句,形成推荐、对词和共现三种数据库。
      第二步、即时根据题目机器合成。
      第三步、即时优化,然后输出。
      我们先说第一步:机器学习了什么?
      举个例子,学白这首《望庐山瀑布》:
      日照香炉生紫烟,遥看瀑布挂前川。
      飞流直下三千尺,疑是银河落九天。
      首先是断词,诗很容易,2-2-2-1,或2-2-1-2不外乎这两种。词则麻烦一些,词有几十个词牌有领字(也叫一字逗、一字领),需要根据词谱来断词。断词完后的效果:
      日照/香炉/生/紫烟,遥看/瀑布/挂/前川。
      飞流/直下/三千/尺,疑是/银河/落/九天。
      断词完,我们要形成三种数据:前后推荐词,对词,共现词。
      1、前后推荐词:50万首诗过一遍,去掉重复的,我们会得到大约120万组“前后推荐词”,什么叫“推荐词”?
      这一首里:“日照”是“香炉”的前推荐词。“香炉”则是“日照”的后推荐词。
      这里说的“去掉重复”,其实,重复对我来说很重要,重复得多,说明古人用得多,说明连贯啊。所以我把重复的次数也放在数据库里,并按照重复次数的降幂为数据库排序。
      2、对仗词:对于律诗,我们从中间两联同时获得了对词,也是去除重复,大约得到100万组不重复的对词,对词哪个对子重复最多,猜猜?“天上/人间”,北京那家夜总会起名字人莫非研究过?
      对仗词只是诗里有吗?不是,不少词里也有。有些词牌某两句会推荐使用对仗句(如浣溪沙),或者某个一字逗后面推荐使用几组对仗句(如满江红)。
      3、共现词:什么叫共现词?
      在一种主题的中,共同出现的词汇。比如一个主题“瀑布”,大约有三四百首诗。这几百首诗里共同出现的词汇,我把他它们叫共现词。
      比如和瀑布这个主题共同出现的词汇大致是:飞流、银河、飞泉、清谷、壁山、烟霞……
      以上三种词汇,在“作诗机”公众号里的超级词汇的功能项都可以查询到。我们先看四首诗,这里面,两首是元稹的作品,两首是作诗机的作品。你能看得出来吗?
      七绝《清明》
      对镜空嗟白发新,微吟还唤梦中人。
      登楼入望青山旧,隔断红尘二十春。
      五律《清明》
      清明来向晚,山渌正光华。
      杨柳先飞絮,梧桐续放花。
      鴽声知化鼠,虹影指天涯。
      已识风云意,宁愁雨谷赊。
      七绝《寒食》
      今年寒食好风流,此日一家同出游。
      碧水青山无限思,莫将心道是涪州。
      五律《寒食》
      伤心曾失所,君子欲何归?
      瑶草诚难补,黄花孰可依。
      愁侵灯自照,老去叶初飞。
      世事同为客,青山对拂衣。
      笔者在17年前(2000年)在这里(诗词比兴)发布了第一代算法的作诗机产品。后因工作繁忙,也便没有更新。前年把自己退休了,看了一下日志,已经被使用超过2亿次。
      上面的其中两个作品是采用第二代算法的机器合成。我发布在公众号“作诗机”上。使用第三代算法的软件预计年内发布。
      我这里尽可能用最通俗的语言剖析一下作诗机的第二代算法。网上时常见到一些大学、科研机构研究的机器合成算法,写得很深奥,其实说白了,都差不多一个意思。
      总的来说,二代算法的作诗机写一首诗,经历了三个步骤:
      第一步、事先让机器学习约50万首律诗和绝句,形成推荐、对词和共现三种数据库。
      第二步、即时根据题目机器合成。
      第三步、即时优化,然后输出。
      我们先说第一步:机器学习了什么?
      举个例子,学白这首《望庐山瀑布》:
      日照香炉生紫烟,遥看瀑布挂前川。
      飞流直下三千尺,疑是银河落九天。
      首先是断词,诗很容易,2-2-2-1,或2-2-1-2不外乎这两种。词则麻烦一些,词有几十个词牌有领字(也叫一字逗、一字领),需要根据词谱来断词。断词完后的效果:
      日照/香炉/生/紫烟,遥看/瀑布/挂/前川。
      飞流/直下/三千/尺,疑是/银河/落/九天。
      断词完,我们要形成三种数据:前后推荐词,对词,共现词。
      1、前后推荐词:50万首诗过一遍,去掉重复的,我们会得到大约120万组“前后推荐词”,什么叫“推荐词”?
      这一首里:“日照”是“香炉”的前推荐词。“香炉”则是“日照”的后推荐词。
      这里说的“去掉重复”,其实,重复对我来说很重要,重复得多,说明古人用得多,说明连贯啊。所以我把重复的次数也放在数据库里,并按照重复次数的降幂为数据库排序。
      2、对仗词:对于律诗,我们从中间两联同时获得了对词,也是去除重复,大约得到100万组不重复的对词,对词哪个对子重复最多,猜猜?“天上/人间”,北京那家夜总会起名字人莫非研究过?
      对仗词只是诗里有吗?不是,不少词里也有。有些词牌某两句会推荐使用对仗句(如浣溪沙),或者某个一字逗后面推荐使用几组对仗句(如满江红)。
      3、共现词:什么叫共现词?
      在一种主题的中,共同出现的词汇。比如一个主题“瀑布”,大约有三四百首诗。这几百首诗里共同出现的词汇,我把他它们叫共现词。
      比如和瀑布这个主题共同出现的词汇大致是:飞流、银河、飞泉、清谷、壁山、烟霞……
      以上三种词汇,在“作诗机”公众号里的超级词汇的功能项都可以查询到。


    IP属地:上海2楼2017-04-12 10:28
    回复
      作诗机这段时间打不开了,为什么


      来自手机贴吧3楼2019-11-08 08:25
      回复