识谣言、辨假货 人工智能已活跃在打假一线

2019-08-06 18:25     来源:     作者:王蔚

  “当真相在穿鞋的时候,谎言已经跑遍全城。”现代社会,虚假新闻、图片、视频,甚至商品等借助网络渠道迅速传播。近日公布的《中老年人上网状况及风险网络调查报告》显示,近六成中老年曾遭受过网络谣言的危害。

  人们常说“流言止于智者”,要想不被网上的流言和谣言盅惑、伤害,首先需要对其进行科学甄别,而时下人工智能正在尝试担任这一角色。那么,在打假一线AI技术如何做到去伪存真?这样的“本领”可应用在哪些领域?

   海量资讯发布,传统识谣模式受限

  “虚假信息的产生主要有两类动机:一类是利益驱动,2018年发表于《科学》的研究发现,要达到相同的传播深度,虚假信息的速度是正常信息的20倍;另一类是政治驱动,在现有互联网经济中,高效传播代表着高额经济价值,人工智能技术会被不法分子用来左右公众对于政治的认知和判断,从而控制舆论,威胁政治安全。研究显示,2016年美国总统大选期间,受访选民平均每人每天接触到4篇虚假新闻。虚假新闻被认为影响了2016年美国大选和英国脱欧的投票结果。”中科院计算所副研究员、博士生导师曹娟在日前北京举办的Women Who Code讲座上介绍。

  为了减少虚假信息,有必要对网络新闻进行认证。但大型资讯聚合类平台每天的新闻发布量一般在50万条以上,显然完全依靠人工认证是不现实的,面向公众,亟待建立高效的AI识谣平台。

  杜克大学新闻研究中心的调查显示:截至2018年2月,全球共有149个正在活跃运营的事实核查类新闻创业项目,其中北美和欧洲74个、亚洲7个。而在一些国外社交平台上,已有自动化可信度评估插件来显示信息的可信度。

  据了解,目前国内已有的主要识谣、辟谣平台基本还是依靠专家识别模式,其存在一定的问题:发现线索主要依赖用户举报,数量有限,时效性不强,往往是事件已造成负面影响才“后知后觉”;此外,新闻认证速度有待提高。Facebook统计,依靠专家辟谣的认证模式平均滞后3天,错失辟谣最佳时期;覆盖类别受限,专家只能在自身擅长的领域辟谣,领域专家库的多样性决定了人工辟谣平台的能力上限。

  为提高识谣效率,目前中科院计算机研究所、阿里、腾讯等多家企业和机构已经开展了人工智能识谣工作。曹娟带领团队从2013年开始致力于开展基于人工智能技术的虚假信息检测研究,她介绍,AI识谣公众平台可自动及时发现可疑线索并进行认证,大大降低谣言可能带来的危害;通过机器学习算法辅助人工审核,仅需1分钟即能对疑似谣言事件发出预警;基于数据驱动的方法,平台还可不断挖掘出不同类别谣言的特性,实现对各种谣言地自动识别。

  不过,需要指出的是,“虚假信息识别是一个高度复杂的问题,一方面是虚假的定义并不明确,需要不确定性建模;另一方面是标注很困难,需要小样本学习方法。目前,机器学习算法的准确率尚不足以完全取代人类,但已能够辅助人类更快更好地审核新闻。”曹娟表示。正如扎克伯格所说,“想要完全依靠AI审核内容,可能尚需5—10年时间”。

  多模态、多层次、多角度揪出假新闻

  “虚假新闻往往从选题、文字表述,到配图都呈现出较强煽动性:一般选题集中于社会热点或争议点;文字描述中情感激烈;配图具有视觉冲击力等。”曹娟剖析道。

  曹娟介绍,目前,中科院计算所开发的辟谣平台已积累数万条假新闻信息,累计认证数十万次。通过平台积累的数据,目前可从新闻质量的角度把杜撰的新闻文本大致分为三类:一完全杜撰,往往是在真实存在的实体上编造情节;二半真半假,可能描述的前半段是真,后半段就展开不可靠的想像,或者一部分是真,但在关键情节上添油加醋;三旧闻新传、移花接木,事件本身可能存在,但发布者故意模糊化甚至篡改原事件中的时间、地点,让人误以为事情刚刚发生在当地被。

  除去文字造假,图片视频造假也越来越多。“我们将虚假新闻配图分为复用的过时图片、能引起歧义的误导性图片及篡改图片。假新闻通常呈现出新闻要素缺失、图像质量低、内容包含色情敏感广告等低俗信息,以及图文不匹配等特点。例如,有些假新闻中的配图会出现满屏弥漫冲天大火、公路凹陷深坑、被弃男童在垃圾废墟前嚎啕等画面。”曹娟描述道,“谣言更易形成病毒式扩散的趋势,而真实新闻的扩散速度和爆发度要温和许多。”

  “从核心技术上,AI甄别谣言依赖于‘三多’。”曹娟说,一是多模态数据,谣言从发布、传播到被辟谣的生命周期中,可能会伴随产生文字、图片、视频、传播网络、参与用户属性等多种模态的数据,各模态数据均能不同程度指示谣言,例如谣言文字的情感倾向、图片的视觉冲击力、传播网络的结构属性等,但没有哪种模态的数据拥有独立完全的谣言指示能力,所以要尽可能获取不同模态的数据。

  二是多层次表示,深度学习技术有强大的表示学习能力,经过神经网络结构和融合机制的设计,AI模型可以在面对众多意义、形式、结构都不同的模态数据时,综合不同层次数据,自动找出最有区分能力的表示组合,并将待甄别文章对应的文字、图片、传播网络等融合投射到特征空间中。

  三是多角度判断,AI可以从单一方面(如内容、用户、传播)给出可信度,也可以全面观察,给出综合所有信息的可信度,及时帮助人们“揪出”可信度不高的信息。

  结合专家经验辨别虚假商品

  曹娟介绍,目前除了鉴别虚假新闻、虚假图片,AI虚假检测技术还可以应用在对虚假商品的检测上,如基于视觉信息技术鉴定一些高档商品的真伪。

  2017年,美国纽约大学成功研发出一套假货鉴定系统Entrupy,用户利用配有微型相机的手持设备对鉴定物品进行拍摄,这个系统利用机器学习算法,分析图像,最终确定产品的真实性。其联合创始人介绍,除了表面是屈光的钻石和瓷器不能检测外,这项技术使用光学分析可测试汽车零部件、手机、充电器、耳机、夹克和鞋子,甚至原油。

  近日,中国科学院计算技术研究所与国内某奢侈品电商宣布共建联合实验室,探索智能鉴定和智能内容分发、在线鉴定商品业务等内容。那么,AI如何对商品,如包、鞋辨别真假;在识别假货方面,AI可替代专家吗?

  “与人识别假货相比,在强度、效率等方面,AI有着突出表现。例如,一般识别假LV包的专家,工作一天只能鉴定五六个包,而AI筛查一个包仅需几分钟。实际操作中,AI先在大量筛选中发现异常情况,报警示错,再由专家来做进一步甄别。即以AI技术打假为主、以人工审核为辅,AI还不能替代专家。”曹娟说。

  曹娟表示,虚假商品检测可形式化为异常检测问题。正品样本往往量很大,但仿品样本量很小,甚至为零。这时候,只能对大量正品进行建模表示,然后对待检测样本,要看它与正品相比是否存在异常。但单纯的数据学习是困难的,鉴别中还要结合鉴定专家的经验知识,以引导模型学到快速定位异常区域的能力;同时,模型通过数据驱动发现的视觉规律,也会反馈给专家。因此,这是一个专家和模型相互学习、迭代提高的过程。

(责任编辑:王蔚)

上一篇:黄铁军: 让AI拥有超人“视力”

下一篇:解锁AI医疗“落地之难”

*免责声明: 凡本网注明“来源:XXX(非神州瞭望网)”的作品,均转载其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。若内容涉及投资建议,仅供参考勿作为投资依据。本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。


推荐阅读
  • AI应用场景多元化,落地与挑战中寻找产业AI化的最优解

    ​10月26日,《2021-2022中国人工智能计算力发展评估报告》(以下简称:报告)在AICC2021人工智能计算大会上发布,旨在通过宏观经济、技术成熟度、AI劳动供给、行业及地域四大方面综合考量和评估我国

    2021-11-01


  • 用AI赋能智能制造转型升级

    ​中业科技成立10余年来逐渐发展成为一家NLP(自然语言处理技术)及应用的人工智能公司,并在智能制造领域取得突破。未来是AI的天下,AI不仅能用于互联网社交,还能在物联网和制造业等领

    2021-10-25


  • 技术与场景深度融合 谱就AI大时代繁荣生态图谱

    ​锁定重大产业方向,设立以头部企业为依托的开放创新平台,让他们在国家人工智能创新体系中发挥引领作用,是国家新一代人工智能开放创新平台设立的关键诉求。 随着国家新一代人工智能

    2021-10-21


  • 着力推动虚拟现实产业高质量发展

    ​新华社南昌10月19日电 2021世界VR产业大会云峰会开幕式19日在江西南昌举行,国务委员王勇出席并致辞。他强调,要以习近平新时代中国特色社会主义思想为指导,全面贯彻党中央、国务院决策

    2021-10-20


  • 世界VR产业大会发布中国虚拟现实产业重要成果

    ​10月19日,由工业和信息化部、江西省人民政府主办的2021世界VR产业大会云峰会在江西南昌开幕。本次大会以VR让世界更精彩融合发展创新应用为主题,设立奥地利和韩国两个海外分会场,吸引

    2021-10-20


  • 传统行业想获得AI加持,为何这么难

    ​AI技术要实现应用,首先数据要达到一定的体量,此外算力也要能支持大规模的模型训练,而后算法方面需要达到一定的精度,端侧算力也要具备一定的推理能力。 之所以目前只有消费互联网

    2021-10-18


  • 山东移动九大模型助力精准“打猫”

    ​近年来,山东移动将防范打击电信网络诈骗作为我为群众办实事的具体举措,持续深化开展春雷断卡行动,推动构建清朗的网络空间环境。 今年以来,依托九大模型精准识别,山东公司已累计

    2021-09-29


  • 敲黑板啦,关于5G网络的重要提示

    ​敲黑板啦~~随着技术更新迭代,越来越多的人开始用5G手机,请注意:使用5G手机却没有打开5G开关,那用的仍旧是4G网络哦~ 这样的设置步骤,你一定要清楚明了 对绝大多数人来说,睡觉前做的

    2021-09-29


  • 2021国家机器人发展论坛在深圳召开

    ​2021年9月24-25日,以创新湾区智造,跨界融合发展为主题的2021国家机器人发展论坛在深圳隆重召开。此次国家机器人发展论坛的举办是学会积极响应中国科协关于开展科创中国品牌工作号召的具体

    2021-09-29


  • 知道创宇入选第九届CNCERT国家级网络安全应急服务支撑单位

    ​9月27日下午,第九届CNCERT网络安全应急服务支撑单位授牌仪式在世界互联网大会的互联网之光博览会举办,知道创宇创始人兼CEO赵伟等13家国家级支撑单位代表出席此次授牌仪式。 知道创宇在

    2021-09-29