现在的 AI 不止会写新闻,还会写书了。 学术出版商 Springer Nature 出版了第一本由机器学习生成的书籍——《锂离子电池:机器生成的当前研究摘要》,它概述了锂离子电池领域的最新研究成果。 * q" t* G# h8 Z$ k5 K
! G+ Z: _. v2 V. i
AI 是如何写出一本书的? 这里面用到的技术,是一种由 Springer Nature 和法拉克福歌德大学共同开发的一种先进算法:Beta Writer。 2 A0 F- n& k$ e/ |5 K! a
它使用的是基于相似性的聚类分析,将海量的源文档排列成连贯的章节,然后创建文章的简洁摘要,同时,将文章内部加入超链接,这样利于读者进一步阅读原始的文章。 而 AI 这种创新化的结构化摘录成书,有利于研究人员更高效地管理海量信息,以及人们从海量内容里快速选择、使用和处理相关领域的文档。 . O" x, d( ]$ K8 k F
2 ]) Z8 N% J* F3 u- Y
所以确切来说,它其实是该学科里面大量研究文章的摘要合集。 但摘要并不是你想的那么简单,这本书里面包含了 2016 年到 2018 年发表过的 150 多篇权威研究论文。仅在过去 3 年,关于锂电子电池的研究论文就发表了超出 53000 篇,这对试图学习这一领域的科学家是一个巨大的挑战,但 AI 的自动扫描和总结输出,能让科学家们把更多时间用在重要的研究上。
1 _6 T5 w7 A# b. W% i7 v
▲ 图片来自:The Verge,摄影:Adam Berry/Getty Images
( v% _5 Q4 X4 H" |2 m虽然它可能和我们想象中的「文采飞扬」、「驰骋墨场」相差千里,但目前它也为研究人员或专业人士展现了一种获取信息的未来方式。 几十年来,机器一直在学习人类语言的微妙之处,虽然深度学习算法不断在更新技术,但就算世界上最能写的 AI 也无法表达出人的独特思想。
8 G. _( |! T3 T
不过前几个月 OpenAI 发布一个名为 GPT-2 的新算法,给它一个标题就能进行语言建模完成接下来的情节,最特别的地方就是能够更灵活地变动内容,甚至写出一篇粉丝小说。
+ |4 Y7 o+ X+ \4 F
& G P( \8 H( V& |) s `
▲ 图片来自:openai 7 n7 @3 p6 {' d1 c9 l1 p4 E+ c
$ T7 D2 B5 x9 W/ R8 w可以预见,未来的学术出版以及各类书籍,将不再只是人为创造,而是有更多形式出现,包括了混合人机文本生成的书籍或完全由机器学习生成的文本。 而对于这本书的情况,Springer Nature 的董事总经理 Niels Peter Thomas 说道:
5 q0 o# c/ M/ l. T- R' n
围绕自然语言处理和人工智能的新技术,为我们提供了在算法帮助下探索内容生成的新机会。作为全球出版商,我们也有责任考虑机器生成内容的影响、机遇、挑战和风险,并为未来的这类新内容提供基础的框架。 ' s# D# |4 U9 S
- j& {2 E+ {4 G
▲ 图片来自:medium
" M% }9 h5 v2 j$ ?目前 Springer Nature 计划通过开发其他领域的内容来扩展这次的试点项目。而《锂离子电池研究原型》也将成为进一步改进此类技术的基础。 如果你想读一下的话,SpringerLink 数据库里现在也免费为读者提供了电子书版本。 * ^* X% m6 p! n2 l% O; t$ q" `
但或许我们更期待看到的是,AI 直接创造出的不仅是文字方面的协助,而是基于文字本身的更有价值的内容。 毕竟每个人的思维都有限,而算法拥有无限可能。 & T) A; O' e- F S8 @" ]. V
|