文 | 扈永顺
当前,AI大模型领域数据投毒现象增多,尤以GEO(生成式引擎优化)技术滥用问题突出。该技术本应应用于优化搜索与推荐引擎,却被部分电商用作批量生成伪原创软文的工具,通过“投喂”手段操纵AI检索结果,导致虚假信息在AI回答中被优先引用,扰乱了行业生态。
数据投毒已成针对大模型的主要攻击方式。2024年,360数字安全集团漏洞研究院发布报告称,数据投毒攻击是目前针对大模型最常见的攻击方式之一,其危害在于干扰模型在训练时期的参数调整,破坏模型性能,不仅降低其准确性,更可能使其生成有害结果。
GEO技术滥用折射治理短板。GEO技术为数据投毒提供了高效手段,暴露出相关平台在内容来源权威性与准确性评估、语料库污染防治方面的责任尚不到位。解决此问题,需要多方协同发力,构建全链条治理体系。
完善法律规制,筑牢监管防线。GEO灰色产业链已有一定规模,但监管层面尚缺乏明确的法律责任界定,需加快人工智能专门立法,明确GEO服务商及AI平台的法律义务;可参照今年1月国家市场监督管理总局发布的《2026年全国广告监管工作要点》中整治AI生成广告的要求,强化规范引导与监管约束,提高违法成本。
强化技术防控,构建可信信源体系。生成式搜索引擎需开发更强的数据清洗与验证工具,优化流量、链接数量等表层筛选指标,引入多维信誉评分、事实核查接口和专家知识图谱,建立动态可信的信源评估机制,从源头阻断低质或虚假信息进入生成流程。
共建优质生态,净化语料源头。政府、研究机构、GEO服务商应合力共建高质量、可信赖的公共语料库,从源头保证AI训练数据“干净健康”。■