Imprimer cet article

Commenter cet article

 
English | Français | Deutsch | Español | 日本語
北京周报中文>>> 中国网事
互联网周刊:搜索视频的“内心”
· 时间: 2007-03-27 ·

什么是互联网上最火爆的词汇?

答案不一而足,但“视频”一定是其中之一。随着摄像手机、DV等个人视频设备的普及,以及互联网宽带的应用,越来越多的视频内容走向互联网。视频搜索的应用已经被提到一个日程,但目前市场上的产品还并不能让人完全满意。怎么能做到精确的搜索?如何快速了解视频结果内容?视频广告还有更佳的策略吗?未来的视频搜索将为你一一揭晓这些答案。

找到被忽略的“猫”

即使是一段时长仅为五分钟的视频,也可能包含着诸多内容,比如,山水场景、人物对话,甚至还有一只卧在角落里的猫。如果这段视频的主题跟这只猫毫无相干,那么它肯定不会被人工编辑在这个视频文件的名称及说明当中。也就是说,在以文字为索引的视频搜索引擎中,是不可能搜到这只猫的。当然,很多类似的细节信息也都被“遗忘”了。

为了解决视频说明内容有限、不够全面的问题,一些搜索引擎中还使用了语音识别技术,即把视频中的人物对话识别为文字,并通过这段文字信息建立索引。但是语音与视频的内容常常有很大的差距,仍旧无法找到这只“不会说话”的猫。也就是说,有很多非音频的信息会被遗漏。

与文字和图片相比,视频作为一个图文、声音集合的时间序列,对搜索技术的要求更高。在目前的市场上,大部分视频搜索引擎所采用的几乎都是文本索引方式。那么,有没有更好的方法,让我们能够搜索到更多的细节呢?微软亚洲研究院(MSRA)研究员华先胜,介绍了一种能够真正“搜索到视频里面去”的索引方式。

这种基于“内容”的索引方式,会首先教搜索引擎“认识”一只猫的形象,并把其“翻译”为文本,以此建立索引。这样,当某个视频文件内出现猫时,它便能够自动识别。与此类似的,想要搜索一场体育比赛中的某个环节,也可以轻松实现。比如,如果要搜索棒球比赛中的“投球”(pitch view)动作,即把“球从投球区投给击球手”的一幕,通常视频的文字不会细致到描述这一动作,而通过这种内容索引的方式则可以准确查到。

内容索引作为文字索引的有效补充,可以使搜索引擎实现更为精确的查询。而上述这些操作有个前提,即需要人为地设定一些训练数据,让搜索引擎进行“学习”,也就是说,要让其“知道”什么场景才是“投球”。据微软的专家介绍,未来将可能完全脱离训练数据,让搜索引擎直接通过网络进行智能学习。

剪辑式呈现

当你得到搜索引擎列出的一大堆杂乱无章的结果后,另一个问题出现了:“究竟哪个才是我想要的?”在实现了精确的查找后,未来的视频搜索引擎要做的另一件事情就是良好的呈现—要让用户快速地了解一段视频完整的内容。

现实中,你在使用视频搜索时往往会碰到这样的情况,明明搜索的是“足球(Soccer)”,但除了你想要的一些精彩比赛片段外,系统可能还列出了有周星驰的《少林足球》,甚至是“小贝”的娱乐视频新闻。针对这种情况,微软亚洲研究院在搜索结果中实现了类别细分的功能,可以按照时长(duration)、类型(genre)、格式(format)等分类标准进行过滤。每个标准下包含几个细分的类别,比如,选择“类型”后,可以按照“体育”、“电影”、“新闻”等类别细分。这样一来,杂乱的结果就变得清晰了。

你可能还会遇到另一种情况,本来搜索的是“汽车”,但却得到了五花八门的视频结果略缩图—因为目前市场上的视频搜索引擎,还不能根据关键字实现动态关联。打个比方,如果你用“汽车”和“交通”两个不同的关键字搜索到同一个视频时,看到的呈现结果是相同的,没有任何变化。同时,这一结果往往不能预览,既看不到略缩图画面,又看不到视频完整的信息,只能点击进去以流媒体窗口的形式边下载边观看,但这必定要耗费时间。

由于网上的很多视频是基于HTTP协议的,这意味着每播放一次视频,都要重新下载、从头播放,即只能顺序播放,无法实现跳转。而MSRA目前有一项技术可以实现HTTP下的自由跳转。

据华先胜介绍,视频呈现中的关键点是视频摘要技术,目前MSRA共研究出了5种视频搜索结果呈现方式,不仅能够动态定位到关键字所在的那一关键帧,而且能让你在该页面下进行10秒~30秒的播放预览。其中,有一种列表呈现方式,除了提供一个“动态略缩图”外,还像DVD的播前浏览功能那样,把每个视频分为可独立播放的五个章节。这样一来,用户就可以大致了解这个视频文件的内容了。而使用该技术所提供的可伸缩呈现方式,则可以实现个性化的片断细分,比如,当你选择按“×4”方式呈现时,原视频即被分为32个剪辑片断呈现出来。

这并不是全部。这种未来的搜索引擎还加入了Web2.0元素—用户可以对一段视频中的某(几)段剪辑,建立个性化注释标签(Tag),并可收藏及分享。这种功能将大幅改善现有视频共享社区的用户体验、增加用户粘性。

改良版视频广告

“锵锵三人行,广告之后见。”观众们总是很想知道,说完这句话后,窦文涛和嘉宾们到底聊了些什么—电视台是严格按照时间来插播广告的,即当节目播到一个固定的时间点,就要插播广告,而且其内容是面向所有用户的,不一定与节目直接相关。

互联网为视频广告提供了更为灵活、个性化的条件。作为最主要的盈利手段,它将直接影响在线视频的发展。但由于受到技术发展的限制,目前市场上的产品还只能做到在一段视频的头、尾位置插入广告,无法做到与视频内容相匹配、智能插入。

为此,微软正在研发一种结合搜索的视频广告平台,可以突破现有的按时间插入的广告模式,从用户体验和广告主利益两个角度出发,实时地在一段视频内容中合适的位置处插播合适的广告。此外,视频广告在环绕文字及场景替换方面也有待进一步的研究。

未来,仍有很多技术方向等待探索。比如,如何准确地把视频内容映射到语意?怎样在保证速度的前提下,处理大量的数据?对视频搜索而言,关键字仍是惟一有效的查询方式吗?你也许将不再只是一个旁观者和使用者,在Web2.0的时代,视频搜索将依靠众人的力量来贡献数据—你将是点燃智能视频搜索引擎的一份子。

 

我要打印 我要纠错
今日要闻 更 多
威州重建新思路:减震、节能、环保
  在汶川重建规划编制过程中,我们特别重视减灾防震体系建设,因为地震以后公众最关注的是安全。”近日,中国外文局赴汶川采访组在威州镇采访时,广州援建前线工作组工程协调部部长徐明贵告诉记者说
世界经济论坛新闻资料
关注主权债务危机问题
金融监管改革或成讨论焦点
中国援海地第二批救灾物资启运
奥巴马国情咨文:“二次刺激方案”成焦点
本刊特稿 更 多
2009年第51期目录
2009年第50期目录
2009年第49期目录
2009年第48期目录
编者札记
文物归宿的本质
达尔文的财富
为了更好的保护
从体育大国走向体育强国
期待电子商务的春天
点击更多
 
北京周报中文网络编辑部 地址:北京市西城区百万庄大街24号 电话:010-68996265
邮政编码:100037     电子信箱:cn@bjreview.com.cn
发行部:010-68310644 68995807 电子信箱:circulation@bjreview.com.cn