专栏名称: 东南大学
欢迎广大师生及海内外校友关注!!
51好读  ›  专栏  ›  东南大学

东南大学在元数据国家标准方面取得重大突破

东南大学  · 公众号  ·  · 2018-01-18 15:49

正文

随着微博、论坛等等自媒体的火速发展,互联网毫无疑问已经成为我们日常重要的信息来源之一。不过要从网上海量的信息当中获取自己真正想要的,可不是件容易事儿。 日前,东南大学院士李幼平,就带领团队制订了一种针对网络搜索的“统一内容标签”,让你在海量搜索中,直抓要害。


- 统一内容标签 -

统一内容标签(Uniform Content Label,UCL)最早由中国工程院李幼平院士提出。李幼平院士1957年毕业于南京工学院(今东南大学)无线电系,他 长期致力于 战略武器电子学研究 曾获得国家科技进步一等奖、国家发明二等奖、国防重大科技成果一等奖等多项奖励。2011年3月,李幼平院士受聘于东南大学计算机科学与工程学院, 组建 东南大学未来网络研究中心并担任中心主任。


▼ 李幼平院士 ▼

研究背景


大数据趋势与互联网飞速发展下的媒体变革,已经促使互联网演变为“博大精深”内容大数据的集散地,实现全民科学享用网络内容大数据, 我国发展未来信息网络 面临三个挑战: 内容共享如何才能普惠全民,内容服务如何才能安全可信,国家如何才能对内容依法治理。 应对这些挑战,需要 建立对内容大数据进行有效标识的创新方法和技术标准。 以此为契机,东南大学未来网络研究中心在李幼平院士带领下,从2013年开始积极推进统一内容标签的标准化工作。


统一内容标签的标准化工作所针对的问题,举例来说,打开一个网络搜索引擎,输入 “企鹅” ,可以看到搜索结果里,有直播平台,游戏,电影,真正的动物企鹅只有一条。为什么会出现这样的情况呢?怎么样 在海量信息中最快找到自己真正想找的信息 呢?这就需要“统一内容标签”了,也就是说,通过 统一“关键词”“信息分类”等规范,剔除80%“文题不符”、关键词和实际内容不符的信息; 同时,通过统计用户之前的搜索习惯、搜索兴趣等,推送用户感兴趣的话题。


1月17日,东南大学在九龙湖校区举行新闻发布会

取得成果


统一内容标签从互联网中 内容资源难找、难管和失序 等问题的根本症结入手,采取内容驱动的理念对内容标识进行全新设计,形成生产、消费和管理三位一体的内容大数据创新标识体系。统一内容标签 能提高海量内容的聚合和分析能力,建立“内容自寻网民”的主动服务机制。


东南大学计算机科学与工程学院副教授 杨鹏 介绍,比如还是搜索“企鹅”,各大网站加了统一内容标签后, 每个信息中企鹅的分类,是什么、干什么、什么时间地点发生的,都有明确划分。 根据用户之前的搜索兴趣,会自动把你有可能最感兴趣的内容推给你,精确抓去兴趣点。


例如早前的网络谣言,“碘盐可以预防核辐射”,如果各大门户网站启用了“统一内容标签”,在你搜索此事时,就会把“碘盐和核辐射的关系”、“权威部门对此事的发声”、“其他门户网站的相关报道”等,打包推送给你。 这样你就能看到各方观点,也就有了更全面的判断。 东南大学计算机科学与工程学院副教授杨鹏解释, “其实就是把散货变成集装箱。”


东南大学未来网络研究中心副主任 杨鹏副教授讲解UCL







请到「今天看啥」查看全文