现在的 AI 不止会写新闻,还会写书了。 学术出版商 Springer Nature 出版了第一本由机器学习生成的书籍——《锂离子电池:机器生成的当前研究摘要》,它概述了锂离子电池领域的最新研究成果。
) |6 E( e2 @9 n7 K" G% [
1 k5 J$ d( H4 B; K; |. L
AI 是如何写出一本书的? 这里面用到的技术,是一种由 Springer Nature 和法拉克福歌德大学共同开发的一种先进算法:Beta Writer。 0 N& t @( j/ l- c" K
它使用的是基于相似性的聚类分析,将海量的源文档排列成连贯的章节,然后创建文章的简洁摘要,同时,将文章内部加入超链接,这样利于读者进一步阅读原始的文章。 而 AI 这种创新化的结构化摘录成书,有利于研究人员更高效地管理海量信息,以及人们从海量内容里快速选择、使用和处理相关领域的文档。
5 m" K$ K8 {6 O: O
8 U2 T' z* E% |! B3 O$ i
所以确切来说,它其实是该学科里面大量研究文章的摘要合集。 但摘要并不是你想的那么简单,这本书里面包含了 2016 年到 2018 年发表过的 150 多篇权威研究论文。仅在过去 3 年,关于锂电子电池的研究论文就发表了超出 53000 篇,这对试图学习这一领域的科学家是一个巨大的挑战,但 AI 的自动扫描和总结输出,能让科学家们把更多时间用在重要的研究上。 3 r7 n4 t, l k Q X! R% {# U" _
▲ 图片来自:The Verge,摄影:Adam Berry/Getty Images
& t6 Q* v- ]. H0 e( e虽然它可能和我们想象中的「文采飞扬」、「驰骋墨场」相差千里,但目前它也为研究人员或专业人士展现了一种获取信息的未来方式。 几十年来,机器一直在学习人类语言的微妙之处,虽然深度学习算法不断在更新技术,但就算世界上最能写的 AI 也无法表达出人的独特思想。
. [: z7 B* h7 F* Y) B% c
不过前几个月 OpenAI 发布一个名为 GPT-2 的新算法,给它一个标题就能进行语言建模完成接下来的情节,最特别的地方就是能够更灵活地变动内容,甚至写出一篇粉丝小说。 3 z: n1 R6 _8 H' m
( h8 H9 g$ k6 r" G# F8 z
▲ 图片来自:openai 4 s: l6 o9 |% U \
4 d: M8 w, v) U p% \/ V可以预见,未来的学术出版以及各类书籍,将不再只是人为创造,而是有更多形式出现,包括了混合人机文本生成的书籍或完全由机器学习生成的文本。 而对于这本书的情况,Springer Nature 的董事总经理 Niels Peter Thomas 说道:
+ b9 c; i9 N: E, d7 M
围绕自然语言处理和人工智能的新技术,为我们提供了在算法帮助下探索内容生成的新机会。作为全球出版商,我们也有责任考虑机器生成内容的影响、机遇、挑战和风险,并为未来的这类新内容提供基础的框架。
3 t% T' O. R2 t6 c
Q5 C# o4 k6 v1 J& o6 ~
▲ 图片来自:medium ) @/ Q* A$ c' ?' [0 o
目前 Springer Nature 计划通过开发其他领域的内容来扩展这次的试点项目。而《锂离子电池研究原型》也将成为进一步改进此类技术的基础。 如果你想读一下的话,SpringerLink 数据库里现在也免费为读者提供了电子书版本。 : F7 J# g* W# n0 j
但或许我们更期待看到的是,AI 直接创造出的不仅是文字方面的协助,而是基于文字本身的更有价值的内容。 毕竟每个人的思维都有限,而算法拥有无限可能。 9 N. }# u9 r# I$ s$ [, R7 k3 P
|