原標題:機器人奪記者編輯飯碗:找出特朗普推特的槍手文字
中國小康網9月27日訊 老馬 機器跟人搶獨家新聞?這事4年前有人預言過:會編程的記者將能搶先報出獨家新聞,搶頭條。
《紐約時報》大樓里確實正在發生機器搶人飯碗的事
英國廣播公司報道,機器人工程師約翰·基弗(john keefe)今年1月在哈佛大學尼曼新聞實驗室(nieman lab)2018行業預測中斷言,這件事今年就會發生。他說,記者將運用ai搶得獨家新聞。
這跟機器人寫足球、財經消息不同。那更多是數據分析整理,然后用自然語言程序組合成文。搶獨家消息是通過機器學習技術識別、發掘出人類單憑自己的大腦難以捕捉到的重要事實和真相。
人機合作已有先行者探路。美國《大西洋月刊》記者麥吉爾(andrew mcgill)把一項枯燥而至關重要的任務交給了機器人助手,@trumpornot,讓它分辨美國總統特朗普的推特帳號下哪些是他本人發的,哪些是手下人代勞的。
這個助手利用機器學習和自然語言處理技術,把特朗普新發的推特文字跟數據庫中的文檔資料對比,然后做出比較肯定的判斷。
麥吉爾在2017年3月發表了自己的實驗結果時寫道:
“機器算法找到的那些最有助于分辨一則推特訊息出自特朗普之手還是工作人員之手的線索,真的很有意思。大部分不是文字,而是特別的拼寫和標點符號?!?/p>
比如,特朗普發的推特更頻繁出現自己的推特名“@realdonaldtrump”,更喜歡用“媒體”這個詞,但顯然不愛用“#”,而手下代發的推特訊息里這個符號更多。
bbc的人工智能機器人叫juicer ("榨汁機")。它的任務是把海量的數據,包括每天的新聞、專題報道、視頻、其他媒體的消息、政府部門和互聯網信息, 等等,用一種聰明智慧的方式聯結起來,既方便調用,又有內在智慧邏輯。
"榨汁機"2012年上崗,每天吸進來自850個新聞機構的rss信息推送,整合處理數據,把bbc和其他媒體的新聞報道分揀出來,然后貼上相應的語義標簽,分成4類歸檔:組織機構、地點、人物、事物。
這樣,記者要查找有關特朗普總統的最新消息,或者ai領域動態的信息,"榨汁機"就會迅速上網搜索,然后給出一個相關內容的清單。