图注:受访者提供的小程序部分操作界面照片
新民晚报(通讯员 张英男 沈俊凯 记者 邱英琼)记者从上海建工集团获悉,建筑行业首个百亿字知识增强对话模型——GPT(Beta版)由建筑人工自主研发上海建工集团第四智能研究实验室)于10月16日正式上线,预计建设专业词嵌入、非结构化文档等相关API接口解析将在今年内开放供行业使用。
-GPT包括四大功能:规范标准智能问答与查新、工程图册详图智能检索、内控技术文档智能查询、私有知识库智能构建。实现了5000多个规格标准、1000多个工程图集,通过对公司内部150多个技术文件的智能分析,技术人员通过对话和提问,只需5-10秒即可调取所需的建筑工程技术数据——与答法。即使在施工现场,也有“行业专家”陪伴。
在过去的一年里,大型语言模型(以下简称“大模型”)逐渐成为人工智能领域最热门的技术之一。通俗地讲,大模型是指包含很多参数、经过海量数据训练来理解和生成人类语言的人工智能模型。通用大模型包括“文心一言”、“科大讯飞”等,可以实现文本摘要、机器翻译、情感分析、数据处理等多种功能,很多数字化转型行业也开始引入大模型技术。拓展业务能力和市场生态,如法律模式“灵医”、医疗模式“心灵医生”等行业模式,取得了良好的社会效益。
建筑行业是目前正处于数字化转型初级阶段的传统行业。在技术资料检索方面,建筑行业仍大量采用人工检索方式,效率低下,主要问题是——
建筑行业涉及的规范和标准数量众多且更新迅速。同一技术内容往往同时涉及多个规范标准和管理文件的要求,难以全面检索;工程图集体积庞大,很难提供某个节点的详细图纸和施工实践。项目具体描述位置难以快速检索;项目技术信息复杂,同一文件往往有多个版本,难以准确检索。
针对这些痛点,上海建工四局建筑人工智能研究实验室自主研发了建筑行业首个百亿字知识增强对话模型——GPT(Beta版),包含两种形式:平台网页和小程序,供企业内部技术人员使用,利用大模型语言生成和知识推理的技术特点,实现建筑工程技术数据的智能检索。
与传统的人工检索方式相比,技术人员可以一次性从多个技术文档中快速获取相关信息,节省大量时间;与一般大型模型相比,-GPT不依赖互联网知识库,加载敏感词过滤算法,为工程技术问题提供更专业、科学、合理的解答。以“女儿墙结构详图”为例,可以同时检索多个涉及女儿墙结构详图的工程图册的具体位置信息,并可以打开索引信息来学习详细方法。
建筑行业涉及大量规范和标准,更新速度非常快。技术人员通常很难理解规范和标准的最新修订版本。研发团队专门建立了规范标准动态数据库,并利用近似最优字符串匹配算法开发了规范标准智能查新功能模块。技术人员只需一键复制粘贴即可快速生成最新结果。未来,-GPT还将推出更多实验室功能模块,帮助技术人员高效工作。
除了规格书、工程图册、公司内部技术文档等公开技术资料外,技术人员往往还需要根据个人存储数据进行相关检索。为此,研发团队自主研发了多模态数据分析算法。技术人员只需一键上传文件,-GPT即可自动解析24类文档、图纸、音频格式文件,建立个人专属知识空间,打造个人专属智能知识检索系统。
未来,上海建工四局建筑人工智能研究实验室将根据用户反馈结果开展强化学习,进一步优化GPT模型性能,拓展GPT产品功能,为项目提供有力支持一线技术人员的管理工作,推动行业数字化转型升级。