现在的 AI 不止会写新闻,还会写书了。 学术出版商 Springer Nature 出版了第一本由机器学习生成的书籍——《锂离子电池:机器生成的当前研究摘要》,它概述了锂离子电池领域的最新研究成果。
' T7 k7 y3 |' `( U6 O, a) u- B
* i+ H9 H5 A5 y4 K/ a3 {
AI 是如何写出一本书的? 这里面用到的技术,是一种由 Springer Nature 和法拉克福歌德大学共同开发的一种先进算法:Beta Writer。
+ \' Y' a0 A4 J# y& V) R
它使用的是基于相似性的聚类分析,将海量的源文档排列成连贯的章节,然后创建文章的简洁摘要,同时,将文章内部加入超链接,这样利于读者进一步阅读原始的文章。 而 AI 这种创新化的结构化摘录成书,有利于研究人员更高效地管理海量信息,以及人们从海量内容里快速选择、使用和处理相关领域的文档。 - W7 b8 w8 [( ~$ H; S
9 B' Y& @0 |0 F Z1 ~3 N$ ^# |
所以确切来说,它其实是该学科里面大量研究文章的摘要合集。 但摘要并不是你想的那么简单,这本书里面包含了 2016 年到 2018 年发表过的 150 多篇权威研究论文。仅在过去 3 年,关于锂电子电池的研究论文就发表了超出 53000 篇,这对试图学习这一领域的科学家是一个巨大的挑战,但 AI 的自动扫描和总结输出,能让科学家们把更多时间用在重要的研究上。
; |# W. M; M3 _9 H1 H6 s
▲ 图片来自:The Verge,摄影:Adam Berry/Getty Images 4 Z+ j! M3 s" V" o$ V
虽然它可能和我们想象中的「文采飞扬」、「驰骋墨场」相差千里,但目前它也为研究人员或专业人士展现了一种获取信息的未来方式。 几十年来,机器一直在学习人类语言的微妙之处,虽然深度学习算法不断在更新技术,但就算世界上最能写的 AI 也无法表达出人的独特思想。 6 v& {7 x7 i, S6 j
不过前几个月 OpenAI 发布一个名为 GPT-2 的新算法,给它一个标题就能进行语言建模完成接下来的情节,最特别的地方就是能够更灵活地变动内容,甚至写出一篇粉丝小说。 5 m/ Q& b0 j: i/ C+ x
- l% H, X& K9 h$ f) k" C7 A
▲ 图片来自:openai
" C2 i% d/ O$ V& f& |7 d. p/ w
2 G% g7 l7 a- a# _. h) S- D可以预见,未来的学术出版以及各类书籍,将不再只是人为创造,而是有更多形式出现,包括了混合人机文本生成的书籍或完全由机器学习生成的文本。 而对于这本书的情况,Springer Nature 的董事总经理 Niels Peter Thomas 说道: 1 A6 Y, F( J4 T4 v% I. U P
围绕自然语言处理和人工智能的新技术,为我们提供了在算法帮助下探索内容生成的新机会。作为全球出版商,我们也有责任考虑机器生成内容的影响、机遇、挑战和风险,并为未来的这类新内容提供基础的框架。
; ^/ P9 S, w: g7 U, X$ v. M
/ u! U ]: w1 i7 b& I+ n% }# d
▲ 图片来自:medium
" q& G$ J. S. K+ j目前 Springer Nature 计划通过开发其他领域的内容来扩展这次的试点项目。而《锂离子电池研究原型》也将成为进一步改进此类技术的基础。 如果你想读一下的话,SpringerLink 数据库里现在也免费为读者提供了电子书版本。 3 \7 M! k6 V: ?5 r4 W* z- P4 r
但或许我们更期待看到的是,AI 直接创造出的不仅是文字方面的协助,而是基于文字本身的更有价值的内容。 毕竟每个人的思维都有限,而算法拥有无限可能。 8 X4 N" y) `4 n. Q* l
|