测年龄软件的背后 只是娱乐别当真


  FaceBook动态消息也都几乎被好友的测试自拍照片洗版。大部分的人都很满意自己的测试结果,因为都比实际年龄小了许多,连微软员工、91岁的奶奶也立马来试,因为她有一张笑开怀的照片测起来只有76岁,马上回春十几岁,奶奶当然乐不可支。

  当然,什么事情都有例外,也有使用者测出来的年纪比实际年龄要大上许多。但是“我看起来几岁”基本上是款相当讨喜的软件,所以也被媒体与网络疯狂转载,也因多数使用者认定其准确度极高(特别针对老人及小孩),即使因为会让人虚荣的不准结果,比如针对东方女性的面孔,就在网络上引发诸多讨论。使用者多数有以下疑问:

  这到底怎么猜的?怎么这么准?为什么我表情不一样,猜的年龄也不一样?这到底是怎么回事?为什么我一直被猜是女生?我明明是男的。

  “我看起来几岁”是微软公司开发人员所开发的软件,当初的目的只是为了在开发者大会(build)对开发者进行展示,以示范使用Azure服务建立智能应用程序非常轻而易举。该网站使用了许多与物联网及大数据相关的技术,包括微软刚发布的脸部侦测API(Face detection API’s)。以下透过熟知内情人士揭晓“我看起来几岁”的幕后花絮,以飨诸多好奇的网友。

  样本从哪里来?起初,网站开发团队只想找50个人作为样本,结果吸引了3.5万人参加。不过几小时内,用户总共上传了21万张照片,网站再用Microsoft Azure云端服务上的Face detection API’s去找出人脸,加以分类,借以辨识是否为同一人。根据一位微软员工表示,“我觉得很准,因为我拿我们家小猫‘阿布’的脸去测,即便它很帅,网站还是测不出它几岁”。性别跟年龄怎么猜出来?要在一两天就写出这款讨喜的App,当然不能不从研究演算法开始,也得站在巨人的肩膀上才看得远。因此,这个开发团队使用微软的机器学习套件——Azure Machine Learning Gallery,由一个名为“牛津专案”(Project Oxford)做出云端智能服务,包含脸部 (Face)、语音(Speech)和视觉(Vision)辨识。另外,开发团队考量使用者除了测自己跟家人的年龄外,也一定会想恶搞一番,找名人或古人的照片来测试。因此,开发团队又使用了Bing Search API去搜索网络上的有趣照片供使用者发挥创意。

  那么,您一定会问,果真如此吗?照片一直不断上传至网站,微软若不存起来要怎么分析、怎么学习呢?问得好!重点来了,分析的关键即是大数据即时分析的神妙之处!别忘了微软还有个秘密武器Azure!

  资料的汇集跟派送可以用Azure Event Hubs,一秒钟可进出几百万份资料,您的照片中不会被存下,微软存下的是从照片中萃取出来的资料。这又是什么资料呢?据说是名为“颜值” 的资料,或许就是青春的轨迹吧。所以请大家尽管放心,您的照片绝不会被留下来。

  但对于写程序的人来说,您一定想知道微软是如何抽取出这些性别、年龄资料做即时呈现的?网友上传照片一定立马想知道结果,没有人想过几天才得知开奖结果,又不是等全身体检报告。当然,这种即时反馈又得靠工具——Azure Stream Analytics,可以让开发者用简单的SQL query语法捕捉到即时的串流资讯,立马回报!根据台湾微软某位主管表示,台湾人是否看起来比较年轻?这仍是个谜,但根据她这几天所看到的结果,好像台湾人普遍看起来年轻很多,前提是只要不要乱做鬼脸或是拍照的环境光线太暗。但是,如果您真的有心想要开发新的App来统计一下,也有好用的工具辅助可做图表分析,PowerBI绝对是您不二的选择。

  总归一句,还是那句老话,实际年龄几岁不重要,看起来几岁比较重要,去玩玩看吧!或许会找到让自己看起来更年轻的秘诀。还有,如果你是开发者,请发挥想象力吧!利用Azure这些API,看你可以写出哪个让大家疯传的App! Technews