今日头条写新闻机器人获吴文俊人工智能科技发明奖
2017年12月23日,第七届吴文俊人工智能科学技术奖颁奖盛典在苏州举行。今日头条人工智能实验室凭借“互联网信息摘要与机器写稿关键技术及应用”项目荣获吴文俊人工智能技术发明奖。本年度获得该奖项的机构还包括清华大学、中科院以及北京航空航天大学等国内顶尖高校。
“吴文俊人工智能科学技术奖(以下简称‘吴文俊奖’)”被外界誉为“中国智能科学科技最高奖”,代表中国人工智能学界的重大突破与最高荣誉。今日头条是今年“吴文俊奖”获奖项目中唯一以企业载体获得专业类奖项的机构,打破了该奖历年只授予顶尖高校、重点实验室和科研机构的传统。
目前,该项成果已于去年以头条号xiaomingbot的形式在今日头条上线,至今已创作超过两万篇文章。机器写稿与信息摘要背后的核心技术是自然语言处理,同时会涉及机器学习、数据挖掘、深度学习、知识图谱等多项技术。自然语言处理是人工智能领域难度最大的课题之一。相对于语音和视觉来说,语言是高度抽象化的表现。一方面,人类语言具有复杂性,同一句话可能代表不同含义。另一方面,正确理解人类语言还要有足够的背景知识,比如对成语和歇后语的理解。这些都是自然语言理解进一步发展需要克服的难题。
此次今日头条与北京大学合作研发的“信息摘要与机器写稿关键技术”提出了多类型、跨领域、跨语言的写稿方法,在以下方面取得了较大突破:一是发明了多文档摘要自动提取方法;二是设计了一种全新的图注意力神经网络生成模型,实现文本新闻概括和摘要生成;三是发明了跨语言摘要方法,实现了英文文本新闻的中文摘要生成;四是通过融合体育领域知识进行智能语句筛选,可实现高质量长 篇新闻报道的实时生成。
基于相关成果,该项目发表国际顶级的ACM/IEEE Trans.期刊和CCF A类长文40篇,获得ACL2017杰出论文奖,申请发明专利22项。
今日头条自动写新闻机器人xiaomingbot2016年6月上线后,在里约奥运会期间创作200余篇赛事报道,累计获得200W用户阅读。其撰写速度与电视直播同步,文章内容涵盖比赛时间、实时比分、运动员信息等主要新闻要素,并且可以自动完成插图,可读性与职业记者相差无几。
奥运会后xiaomingbot还在持续撰写NBA、CBA、中超、意甲等体育赛事的文章,包括很多场冷门比赛,xiaomingbot也均有报道。根据今日头条统计,xiaomingbot文章的阅读率与人类创作者基本持平。
近期,xiaomingbot已完成最新一轮升级,除体育新闻,xiaomingbot撰写的文章现已涵盖科技、财经、房产等十几个分类,并可实现多领域每日热点新闻的自动创作。据记者了解,xiaomingbot已与光明网、《财经》杂志、大河报等主流媒体达成战略合作,向其进行优质内容输出。
今日头条人工智能实验室总监李磊博士表示,xiaomingbot的意义在于,一方面能够更大程度的满足长尾的资讯获取需求,另一方面,一些消息类报道使用机器人写作,能使记者从疲于奔命式的抢新闻中解脱出来,对事件背后的新闻线索进行深入挖掘和批判性地思考。
“我们做新闻机器人的目的并不是取代新闻记者,而是帮助记者创作出更高质量的内容。”李磊说,“未来今日头条人工智能实验室将会对对前沿技术进行研究,为信息的创作和分发提供更多支持,更好地实现人与信息的连接。”
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- Python GUI项目实战(三)实现信息查询功能
- 在 Kubernetes 上使用 Argo 实现 CI/CD
- 微信小程序:授权登录 + 基于token的身份验证详解
- 「最强」Lettuce 已支持 Redis6 客户端缓存
- Go中校验一个字符串是否是有效的JSON字符串
- 在 Vue 中,如何从插槽中发出数据
- Azure DevOps+Docker+Asp.NET Core 实现CI/CD(二.创建CI持续集成管道)
- 这样的奇技淫巧,劝你不用也罢
- 我服务又双叒叕奔溃了,含泪干货分享
- Azure DevOps+Docker+Asp.NET Core 实现CI/CD(一 .简介与创建自己的代理池)
- Android数据库高手秘籍(十二),LitePal的索引功能
- 使用pm2管理go应用进程
- 用Docker搭建Redis主从复制的集群
- IDEA 非常重要的一些设置项 → 一连串的问题差点让我重新用回 Eclipse !
- ArrayList源码分析(基于jdk1.8)(二):subList陷阱补充