29岁的吉恒杉坐在电脑前,手指轻轻点击鼠标,将屏幕上成百上千幅内容各异的画面标注成两类——“接吻”和“非接吻”。作为某视频网站的一名人工智能标注员,他正在训练机器识别何为“接吻”镜头,因此也被戏称为“吻戏鉴定师”。
吉恒杉毕业于北京航空航天大学,硕士学的是计算机视觉,通俗地讲,这个专业的目的是“教电脑看懂世界”。去年9月他加入优酷成为一名高级算法工程师,目前的主要工作是教计算机识别接吻、牵手等场景,也被称为“吻戏鉴定师”。“这个岗位给大家传递快乐和幸福,又能以工作的名义看网剧综艺,我特别喜欢。”谈起自己的工作,吉恒杉一脸笑容。“刚开始我和女朋友说,我的工作是训练计算机识别出吻戏镜头,她听完觉得特别不可思议,谁能给钱让你干这个呢?” 视觉中国
这项看上去高冷的人工智能黑科技,在最初的环节真的需要不少“人工”。吉恒杉从图片库和视频中截出数千幅图片,从中一张一张标注出“接吻”的画面,最多时一天标注上千张。通常数据标注得越准确、数量越多,模型的效果就越好。自然,机器识别的效果就会更好。
机器毕竟不是人,对有些复杂情况也无法识别。比如,为了拍出唯美画面,“接吻”这个姿态也千差万别,有的深情对视,而有的若即若离,团队里的“吻戏鉴定师”们不得不打印出角度各异的“接吻”画面贴在墙上,一群人激烈讨论到底怎么才算“接吻”。
“吻戏鉴定师”是个技术活,需要根据机器的反应进行繁琐的后期调试。机器学习了上千幅图片中的特征,这时再给机器任意一张“接吻”的画面,它就能认出来了。截止目前,吉恒杉和同事们已经为2万多条“吻戏”打上了标签。