一、AI的快速发展回顾
新质生产力是以新技术深化应用为驱动,进而构建起新型社会生产关系和社会制度体系的生产力。2024年政府工作报告中,发展新质生产力位列政府十大工作任务的首位。人工智能作为新质生产力的重要推动力,加快发展新一代人工智能对于形成新质生产力具有重要意义。而人工智能作为新一轮科技革命和产业变革的重要驱动力量,是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
随着Open AI引入了基于人类反馈的强化学习技术,实现了人工智能的模型输出内容与人类的常识、认知、需求、价值观等相一致。自此大语言模型(Large Language Model, LLM)进入了公众的视野当中。大语言模型是指具有相当规模(包含数百或数千亿个参数)的预训练语言模型。从庞大、多类型的场景数据中学习,总结出不同场景的通用能力,学习出一种特征和规律,成为具有较强泛化能力的模型库。大语言模型具有自然性、泛化能力、高效性等优势。在LLM时代已然到来的今天,AI辅助决策与企业管理成为大势所趋。
图 1.大语言模型发展图谱(截至2023年8月)
资料来源:Environ. Sci. Technol. 2023, 57, 46, 17667–17670
而人工智能生成内容(AIGC)是建立在多模态之上的人工智能技术,即单个模型可以同时理解语言、图像、视频、音频等,并能够完成单模态模型无法完成的任务。过往的内容创作生态主要经历了专业生成内容(PGC)、用户生成内容(UGC)到AI辅助用户创作(AIUGC)的几个阶段,但始终难以平衡创作效率、创作成本及内容质量三者之间的关系,而AIGC可以实现专业创作者和个体自由地发挥创意,降低内容生产的门槛,带来大量内容供给。LLM具有处理自然语言的能力,可以对文本进行理解和生成。而AIGC正是利用这种能力,通过深度学习技术,实现对内容的自动生成。LLM为AIGC提供了强大的自然语言处理能力,使得AIGC在内容创作方面具有更高的效率和准确性。
图 2.内容创作模式的四个发展阶段
资料来源:《腾讯研究院AIGC发展趋势报告》,腾讯研究院
我国AIGC产业发展目前已经发展出了两类主要业态。
一是面向C端用户,提供的产品可以以模态划分为文本生成、图片生成、音视频生成、其他生成等多样内容形态。
二是面向B端企业客户,更多是基于特定领域提供专业服务。
目前布局较多的赛道包括游戏、媒体/影视、电商及广告营销等重内容赛道。未来相信AIGC将继续延展产业链,并在商业化场景上持续拓宽拓深,深入变革各个行业。
图 3.我国AIGC产业发展业态
资料来源:《2023年中国AIGC产业全景报告》,量子位智库
聚焦到金融行业,AIGC在的应用存在前台、中台和后台的分野,基本涵盖市场营销、投研项目、产品设计、风控合规、客户服务、运营管理,基于底层人工智能技术支撑得以实现。前台营销及中台部门应用较为广泛,前台营销部门利用AIGC智能撰写及推荐等。中台部门利用AIGC可打造风控中台、客服中台等,商业化产品已经较为成熟。前台投研存在较为复杂的建模、尽调等工作,但目前生成式AI产品主要为开源的大模型,商业化程度低,AIGC在短周期内仍主要承担辅助性工作。
图4:AIGC在金融行业的应用场景
资料来源:《2023年AIGC场景应用展望研究报告》,艾瑞咨询
与此同时,本文的另一个关键词ESG是指环境(Environment),社会(Social),治理(Governance)三大因素,ESG概念首次在2004年的联合国全球契约计划中被明确提出,是一系列衡量企业环境、社会、治理绩效而非财务绩效的投资理念和企业评价标准。随着企业在可持续性和社会责任方面的期望不断提高,ESG已成为评估和定义这些努力的关键框架。而AIGC以其在数据处理和模式识别方面的前沿进展,为解决ESG挑战提供了创新途径。从AIGC在ESG领域展现出强大的未来应用潜力来看,它不只是为企业提供了一种工具,更是对传统企业哲学的一次颠覆性创新。
图5:AIGC在公司治理领域的应用场景
资料来源:i人事一体化HR系统
二、现状:人工智能在ESG领域应用
人工智能在ESG领域应用中的核心技术是检索增强技术(RAG),通过该技术能够为大模型提供外部知识源,这使它们能够生成准确且符合上下文的答案,同时能够减少模型幻觉,其可分解为三个主要流程:索引-检索-生成。
索引(Indexing):文档清洗后转换为统一的纯文本格式,根据语言模型的上下文限制将其分割成更易于处理的块,块使用嵌入模型编码成向量表示后存储在向量数据库(Vector database)中。
检索(Retrieval):使用相同嵌入模型将查询转换为向量表示,余弦相似度计算查询向量与索引语料库中块向量之间的相似度得分,系统分数优先检索与查询最相关的前K个块(top-k)用于扩展上下文。
生成(Generation):用户提出的查询和选定的文档用模板的形式被合成为一个连贯的提示(prompt),大模型根据这个提示生成回答。
分别从ESG的三个维度来看,在环境(E)维度,已经出现结合政府间气候变化专门委员会(IPCC)报告的气候科学大模型。基本解决大模型的幻觉和过时信息问题,打造气候领域的专家系统Chat Climate。三种Chat Climate包括:
Hybrid Chat Climate:根据给定的信息使用自己的知识提供答案。
Chat Climate:聊天机器人仅根据 IPCC AR6 提供答案。
GPT-4:提示不提供任何额外信息或有关如何提供答案的说明,基线行为。
同时清华大学环境学院徐明团队于2023年3月17日上线的kaiwu大语言模型,为全球首个结合可持续发展领域人类已有知识的环境领域的大语言模型。
图6:Chat Climate的技术原理
资料来源:Vaghefi S A, Stammbach D, Muccione V, et al. ChatClimate: Grounding conversational AI in climate science[J]. Communications Earth & Environment, 2023, 4(1): 480.
在社会(S)维度,2024年4月,华中科技大学探索了AI Agent在供应链管理中的作用,如优化通信、自动化流程和增强决策支持系统等方面,帮助企业更好地理解市场需求、风险因素和供应链瓶颈。强调了模型基础设施、生命周期管理以及下游应用生态系统三个核心组成部分:
基础设施:这是供应链的基础层,包含了支持LLM高效训练、优化和部署的必要数据集和工具链。
模型生命周期:LLM的整个生命周期,从开发训练到部署和维护。它涵盖了LLM经历的一系列过程,包括使用训练数据集的开发和应用、测试和评估的迭代周期,以及为确保模型随时间保持有效和安全所需的持续更新和维护。
下游应用生态系统:利用LLM能力的应用和服务。包括将通用LLM能力适配到特定需求的领域特定模型(DSM)。
图7:AI Agent在供应链管理中的作用
资料来源:Wang S, Zhao Y, Hou X, et al. Large Language Model Supply Chain: A Research Agenda[J]. arxiv preprint arxiv, 2024: 2404.12736.
在企业治理(G)维度,图5展示的i人事一体化HR系统就是一项成功的应用成果。此外,在广义的治理上,2024年3月,华南理工大学提出AlphaFin框架,结合了传统研究数据集、实时金融数据和手写思想链(CoT)数据训练大语言模型。使用AlphaFin数据集对称为Stock-Chain的最先进方法进行基准测试,以有效地处理财务分析任务,大大提高股票预测的精准性和结果的可解释性,这项研究成果使得人工智能参与到了企业投资决策的制定当中。
Stage1股票趋势预测:展示了股票预测系统在实际市场中的年化回报率和准确性。
·问题定义:对于一组公司C和相关知识文档D,通过预测系统预测股票趋势。
·知识处理:为每家公司检索相关文档,结合提示模板和文档内容,形成输入。
·股票预测精调:使用AlphaFin数据集中的金融报告数据训练股票预测系统(StockGPT)。
·预测与后处理:StockGPT根据输入预测股票上涨或下跌,并从响应中提取具体预浤结果。
Stage2金融问答:通过用户评价和机器评价,证明了模型在处理实际金融问答任务中的有效性和优越性。
·向量数据库构建:使用文档的关键知识构建向量数据库,以便快速检索。
·知识检索:通过用户查询在向量数据库中检索相关知识文档,辅助生成响应。
·LLMs精调:在第一阶段的基础上,进一步在AlphaFin数据集上训练模型,增强金融问答能力。
·响应生成:根据检索到的知识文档、对话历史和用户查询生成响应。
图8:利用检索增强的股票链框架进行基准财务分析
资料来源:Li X, Li Z, Shi C, et al. AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework[J]. arXiv preprint arXiv, 2024: 2403.12582.
最后综合ESG整体来看,2023年11月清华大学环境学院李楠团队主持申报的项目“基于大语言模型评估企业碳披露质量的ESG文本分析工具研究”荣获SMP (Social Media Processing)-智谱AI大模型交叉学科基金,证明人工智能已经能够切实参与到ESG的相关实践活动中。
就该项目而言,企业产品生命周期碳足迹刻画涉及众多供应链主体,数据采集与公开存在困难,导致ESG报告成为“黑箱”。由此引发的信任缺失影响了消费者、投资者和监管机构对企业的评价效果。因此,透明、详细的碳披露是强化企业环境责任、提高社会认可度、改善ESG生态的根本。
因此为激励企业积极进行碳披露,增强评级机构及公众对企业ESG报告的信任,该项目将重点围绕碳排放,系统构建企业ESG报告碳披露质量多维度分析模型,并提供基于大语言模型的智能分析工具,实现对企业ESG报告碳披露质量的智能分析,推动环境科学、数据科学和人工智能等学科的深度融合。
图9:利用检索增强的股票链框架进行基准财务分析
资料来源:清华环境学院官网
下一篇我们将深入探讨AI面临的能源危机,以及清洁能源如何为AI发展提供可持续的解决方案,并进一步分析AI技术未来在ESG领域的潜力和挑战。
来源:大象绿金
原创声明
如需转载、引用本文观点,请注明出处为“中央财经大学绿色金融国际研究院”。