■受访人:梁 翃(北京看山科技有限公司创始人) □采访人:孙 珏(中国出版传媒商报记者)
去年9月,本报记者采访了北京看山科技有限公司创始人梁翃,聚焦“AI绘图已将复杂的人工绘图成本降低80%以上”话题,引起业界强烈反响(链接:2023年9月1日11版)。时隔一年,AI在出版行业的应用有更进一步突破,如有出版机构设置“单独部门”统筹AI出版试验,但更多的是以出版从业者个人的“工作辅助”性尝试居多,未形成大规模的出版机构顶层设计案例。而在为数不同的能垂直赋能出版行业全产业链的案例中,看山科技用1年时间迭代了自己的服务能力。据记者了解,今年该公司的AI技术应用实践除了降低图书插画环节的成本外,在文稿加工、编辑校对、选题策划、图书嵌入AI人机对话、营销数字人等多个维度实现了行业落地。
看山科技是一家教育内容公司,在教育信息化领域耕耘了近12年,之前做短视频内容,做了约3万个短视频和10万的微课和近300万的教学资源,服务超3000所学校。2022年开始接触AIGC,并很快利用AIGC调整了业务方向,目前有三大板块:“疯鸟AI”品牌,为出版等行业提供设计服务;爱奇多亲子AI艺术课程,培养孩子的想象力和创造力;职业教育AIGC行业应用课程,赋能职业学校,培养新一代职场人。
□目前,看山科技在提升图书插画效率方面达到的最好水准是怎样的?
■插画效率的提升跟插画类型有关,相对而言,效率达到10倍问题不大。效率提升最高的插图类型是标准化插画,如词汇类、字典类配图,画面风格统一、插画内容简单不需要复杂的场景、动作、表情,这样的插画类型相对于人工效率提升,可达百倍以上。我们现在的设计团队只有10个人,他们1个月可以画1万张图。相对于原有人工插画师,平均效率提升10~30倍。极致情况下我们出一套书的插图,一台电脑一天可出5000张图,是指同事下班电脑自动出图,早上收到就可以开始筛选图。非常多的事情已经有变化。我原来找插画师要求画功好,现在一定要有很好的审美力和选图能力,要选出最好的图以及最少人工修改的图。
□与哪些出版机构达成了插画层面的合作?
■我们与知识出版社合作了中学生文学读物,与童趣出版公司合作了绘本插图设计,和吉林科技出版社合作了儿童科普图书,和中国少年儿童新闻出版总社合作了期刊内页设计,与吉林出版集团外语公司合作了“快乐读书吧”丛书插图设计。目前,AI能够覆盖的插图类型越来越广泛,除了科学性较强的工程类、医学类等专业图书外,可以覆盖大部分图书类型。
□看山科技在文稿加工、选题策划方面可以达成什么样的效果?
■我们作为一家成立了十年以上的内容公司,2022年年底就开始用AI进行文稿撰写。最初和大家的感觉一样,觉得AI撰稿很难达到预期,但在不断实践中,通过prompt的优化以及工具的组合运用,目前在课程开发、图书文稿、营销文章上已广泛应用了AI工具。我们与人民邮电出版社合作的图书已用到AI工具做选题开发和文稿梳理。从时间上来看,他们大概用了一周时间,完成内容框架的搭建和图书文稿内容撰写。
□内容策划方面,能否列举一些实操案例谈谈落地实践?
■我们做了“爱奇多亲子AI艺术课程”。利用AI工具让孩子学画画,通过使用AI创作工具,孩子们可以自由创作各种艺术作品,同时训练了思维能力、表达能力和美学素养。每次创作好像是在创作一个小作文,孩子们学会了描述人物时要有表情动作,描述景色要加光线、角度等。这个平台只有两个按钮,一个是说话键,一个是发送键,孩子通过这两个环节可以完成整个创作过程。目前,这套课程有3000名学员完成了学习。未来,超级个体的小朋友拿起笔就能写故事,创造很好的音乐,借助AI创造非常感人的画作,这样的小朋友在下一个时代会大量涌现。
具体来看,我们自己开发的“爱奇多亲子AI艺术课”课程结构由专业教研人员设计,但课程中讲解的口播稿都是借助AI生成的。同时,课程中的很多环节,例如“跟着儿歌学名画”,借助AI为每个艺术大师生成新的数字内容,同时我们也运用文生音乐工具生成儿歌。孩子们可以一边跟着儿歌哼唱,一边欣赏名画中的美好场景。这门课程的内容又在AI辅助下,改编成图书,即将在7月出版上市。
□ 从看山科技的实践看,图书嵌入AI人机对话已在哪些图书上使用?
■我们刚刚开发了一款新产品,叫图书精灵。简单说就是读者买到书后扫描二维码或特定图案,从而激活一个自定义形象数字人,这个数字人可以是出版机构的IP,也可以是书中的人物。读者可以与数字人就图书内容进行自由对话。这种形式大大改变了读者阅读图书的方式,同时当读者的问题超出书籍对应主题时,图书精灵还可以推送相应其他图书的购买链接,对于出版机构而言也是很好的营销推广。目前来看,知识类图书,如专业书、科普书、教材教辅类图书,都很适合图书精灵的应用。我们甚至认为,未来会有相当比例的图书,有类似图书精灵这样的“AI inside”链接。
□ 图书嵌入AI知识模块,是否会涉及到其他图书或内容领域的侵权?
我们推出的图书精灵所“投喂”的语料,在没有得到授权前提下,不会直接应用图书内容,而是围绕所嵌入图书的主题,进行知识图谱的重新构建和语料梳理,设计成对应每本书的本地知识库,供AI工具调用。但针对类似产品,目前国家还没有相关约束性法规出现,是否市场上会出现大量侵权语料内容,我们也持忧虑态度。
□AI需要不断用数据喂养,如何做到相关图书知识模块构建过程中,不断迭代?
■图书精灵还只是一个常识性产品,在这个过程里需要进行本地知识库的搭建和数字人制作、调用等多个过程,需要用到多种AI工具组合,我们也会在后续服务过程中不断迭代。
□看山科技在为出版机构服务过程中,拥有自己的技术平台还是以工具综合调用为主?
■我们并未开发自己的技术平台,秉持应用领先的价值观,我们更喜欢综合调用多种AI工具解决客户的各种问题。AI正在高速发展阶段,为了解决客户在垂直场景中的具体问题,我们会随时评测、尝试最新AI工具以及构建更加合理的工作流来提升服务品质。看山拥有自己的专业技术团队,在安全性和稳定性上会给客户提供最好保障。
□辅助出版机构进行营销数字人的制作和应用情况如何?成本如何?
■我们在图书精灵产品和新媒体营销环节应用到了数字人。目前数字人的制作成本几乎可以忽略不计。当然,如果从营销角度,出版机构需要设计自己专属的IP形象,成本还是有一些,根据IP形象的要求成本略有不同,不过应该完全在出版机构的可接受范围内。
□现在AI工具的使用在出版流程中已经顺畅了吗?
■是的,我们从文稿撰写、插图绘制、版式设计、文章翻译、校对、融媒体内容制作、图书及课程新媒体营销等环节已经非常顺畅地应用到多种工具。
□出版行业的图书制作流程需要多环节支撑,您觉得AI目前已经可以取代哪些环节?
■目前很难说AI取代了哪些环节,更精准的表达是几乎每个环节都因AI的接入效率大幅提升。我们自己的亲身经历是,原有图书插图的样稿环节,因为AI的超强算力,通常可以一次性提供数十种风格供出版机构挑选,改变了原来的画样图并反复修改的冗长流程。同时,我们一个团队可以完成文稿撰写、插图绘制、版式设计等多个模块工作,可以大大减少跨团队沟通成本。同时这也代表着,行业上下游开始出现整合趋势,或许未来像看山科技一样可以综合提供图书一体化设计服务的公司会越来越多。
□看山科技是否在帮助大型出版机构做全面构建出版生态环境基础设施?具体涉及哪些环节功能?
■目前我们正在与出版领域的几家上市公司洽谈合作,就版权保护、AIGC一体化平台搭建等方向进行探讨。虽然并未有项目开始落地,但已经看到这些大型出版机构开始在AI时代承担起行业领军者的角色和使命,相信新的出版生态构建不会太迟。
□出版行业的工作模式已经发生了改变?
■从看山的角度,我们公司团队内部组织架构已经发生了变化。原来工作流程是线性结构,从教研人员到文案人员,再到插画师,最后是动画视频工作人员。现在变成小组,每位小组成员都可以完成包括文稿、插画在内的2~3项工作,小组按照内容来划分,以便成员可以积累同一主题方向的专业性内容。最近有出版社委托我们做一套书,给了我们几个核心词汇,我说“你的框架呢”,他说“没有框架”,我们带着AI做了一套书籍的整体框架,顺利地通过了出版社的审核。从框架到文稿再到插图到版式,这意味着出版行业原来一本书需要五六个环节,包括作者、插画师、美编、校对、翻译等等,现在只需要一个人或小组就可以完成。
□您觉得,AI会对哪个出版领域产生迅速且深刻的影响?
■我觉得是教育出版。AI的基本原则是算力、算法和数据。教育要思考的是教育目的、教育本质、教育方式。更多的创业者聚焦的是AI对教育方式的改变。比如,我们现在大概每一两周会测十几二十种AI工具,包括教育工具,测试了很多。教育内容的生成,比如教学设计、教案生成、教学游戏、试卷生成等,这是AI的算法和数据结合到一起实现的。然后是个性化学习体验、个性对话、虚拟空间,也是数据和算力可以做的事情。
这些当然很重要,此外,我们做了很多年教育,真正要探讨的是“我们要去哪里”。麦肯锡报告提到,2030年应该做什么工作?他们访问全球很多应用了AI的企业家和职场人,得出的结果是,他们认为,2030年,在高级认知技能方面情况有些复杂,创造力的需求仍然在高位,预计将增加12%。但其他如高级读写和写作,定量和统计技能需求会下降19%。备受追捧的新技能是社会和情感技能。预计到2030年这些技能在欧洲需求将增加11%,在美国将增长14%。我们的教育体系一直在为社会提供源源不断的人才,当社会变化时,教育体系可能来不及那么快作出反应,但教育从业者可以更多思考:我们现在培养的人能适应未来社会吗?