生成式人工智能 阅读小记
书名:产业专利分析报告(第96册)生成式人工智能(AIGC) 作者:国家知识产权局学术委员会 出版社:知识产权出版社 出版时间:2024.7 ISBN:978-7-5130-9369-9
换了主编之后岷县感觉质量上去了。 去年搞了13个课题,选了7个:AIGC、晶圆制造、固态电池、氢储运、可控核聚变、靶向蛋白降解。 以前是以秀宏观层面可视化图表为主,文本内容基本上都是水过去的。去年这几本明年感觉在分析方法上下了很大功夫,尤其是在微观技术路线总结层面,应该不只是有情报人员参与,也有一线技术专家参与的。 这本是审协北京中心写的,技术资料的引注和商业情报的融合都比较用心。
个人角度看这里面比较核心的内容是第二章开头的技术分解表。 数据生成、算法模型、算力支撑,基本上奠定了后续延伸性研究的基础。 数据生成:主要分了数据集构建、数据合规两个板块。 合规板块在技术构成分析的时候,和数据集构建放在同一个技术分支档位上横向对比了。而对于合规的具体技术内容,报告选择不展开。 如果在公司介绍方面不直接照搬官网的介绍就更好了。 (说明商业情报的融合也只是刚开始探索,比之前强哈)
第六章讲布局策略的部分,算力支持板块的分析明显比其他板块深入许多。 推测原因,一方面是芯片、算力硬件方面的审查员多,案件积累也有一定量,能够总结不少干货;另一方面是,这块的综述性技术资料也比较容易获取,尤其是中文技术资料。 而模型本身感觉论述就不是很自信了。 一个是对于主流产品和技术和遗漏。 多模态大模型介绍了一个OpenAI的,一个百度的,按照成稿时间2023年底算,其实好几个重要的大模型都没纳入进去。 就多模态而言,阿里和字节走了两条产品路线,字节倾向于直接继承多模态功能,阿里产品是分开的,倾向于面向应用层的用户需求开发单独的解决方案模块。腾讯和阿里类似。 这些重要的信息应该是在报告中有所体现的。 二个是对于重要商业思路域技术演进关系的遗漏。 而有一个关键的问题报告没论述,就是大模型的调用和数据接口问题。 这其实是一个商业问题衍生的技术问题,但是对于大模型的应用方向分析还是很重要的,可以补上。 三是对于关键专利技术与产品服务对应关系的模糊化处理。 在大模型部分其实已经看不见多少对于专利本身的解析了,基本上是在照搬公开报道中的商业产品/服务和技术介绍内容,这些关键产品/服务对应了哪些具体专利,报告其实也说不上来,就是在每个板块对各个公司的宏观专利统计数据做了阐述, 后面终于找到了一个专利和产品/服务对应性稍微存在(至少在分析执行层面能写)的部分,就开始无逻辑直接罗列技术内容了,和前面标题的结论、小节开头长篇大论的技术分析之间缺乏基本的逻辑联系,以至于后文直接走流水账模式,连个思维小标题都不敢写了。
这个也是个普遍问题。 搞大模型的根本不搞技术情报,甚至这个领域很多关键技术信息都是公开传播的,没有知识技术垄断问题,这和传统的专利领域的技术壁垒明显不同。报告里面没有指出这一点。 同时,正因为上一条原因,很多重要的开源技术实际上没有被纳入专利分析的范围内,使得从整体技术架构上看,缺失不少关键环节。 最后就是人的问题,事在人为。尽管这几个领域这些年是有一些专利案件积累,但是一线接触的零散技术和产业上大规模、系统应用的技术之间仍然是存在断层的,尤其是基于创新主体发展逻辑的断层。那么必然的,不具备一线经验的情报人员在解读特定专利/专利组合与特定商业产品/服务之间的关系时,仍然会陷入一个很尴尬的境地。
总的来说,情报辅助的功能仍然没有改变。这本算是一种新的分析方法的探索。但是话说回来,它对于外行的科普功能重要,还是对于业内人士的情报参考功能重要,就是另一个议题了。