每個人身體里都有一個“杠精”:“這可不一定”“我可不這么認為”“那可說不準”……這些“杠”詞要么在心里默念、要么在口中碎碎念、要么大聲講出來,無論是否表達,“杠”的意識出現均是人類獨立思維的表現,所基于的正是人類的綜合分析能力。
如今,人工智能(AI)也開始“杠”得有條理、有邏輯、有思路起來。日前,在百分點舉辦的無界智能發布會現場,IBM大中華區全球信息科技服務部總經理謝少毅介紹了人工智能做辯論的項目,“杠精”們大愛的口頭禪出現在了IBM的人工智能系統 “Project Debater”口中,這背后是機器學習、自然語言處理、海量數據搜索處理、識別情緒等大量人工智能技術的應用。
越來越多的人工智能研究者發明新的技術讓AI向人類“偷師”,一定程度上習得觸類旁通、獨立思考的能力。從“傻白甜”到“杠精”,AI向真實的“人”又貼近了一步,從“感知智能”慢慢走向“認知智能”,哪些技術是AI不可或缺的?還有哪些仍待攻堅呢?
從理解語義到“讀心術”,認知智能初現
“你告訴一個AI自己有減肥計劃,AI如果每天建議你吃沙拉,你就會說它不好,不符合心意;如果它天天讓你吃蛋糕,你也會說它不好,不符合減肥需求。”上海紐約大學商學部主任陳宇新教授舉了個連真正的人類都難以把握的兩難抉擇,充分說明理解語義并不一定能夠真正把握要義。
“雖然主人說這是我想要的,但AI做了之后,主人仍會說這不是他想要的……”擁有“認知智能”的未來AI將充分理解這句堪比繞口令的實質,陳宇新認為,當數據足夠多、算法足夠強大、模型足夠優秀之后,AI將從理解語義到擁有“讀心術”,分析推測出人類當時可能都不確定的真正想法,在人心里矛盾時給出“撓到癢處”的答案。
將這個“減肥吃什么”的難題放大來看,就是對正反的“兩難”進行一系列諸如身體指征、愛好、時間等多維度的數據綜合分析后,用到大量的人類學、心理學、社會學的內容和方法,通過一系列探索性地問答獲得數據,給出結果。
這種探索性的分析將使AI得到進化,并擁有更廣闊的“職業”選擇。據介紹,美國有公司做出了第一個人工智能律師ROSS,美國一個律師以往用上百上千個小時做一個案例的分析和調查,現在用了ROSS和人一起合作,時間減少到28分鐘,ROSS,可以提供正反雙方的意見讓律師做決策。
“正反意見的博弈還可以幫高層做決策,可以通過一個機器人提供正反兩面意見的辯論,幫助高層綜合分析做更好的決策。”謝少毅認為,這方面的研究才剛剛開始。進化的AI將被用在更多需要做信息分析或做決策的領域,例如高級銷售、經濟分析師、企業高級管理人員等。
數據動態融合,AI走進認知智能的“基石”
從海量數據中“摘出”與當前任務關聯的數據,是AI擁有綜合分析能力的第一步。百分點董事長兼CEO蘇萌表示,AI走進認知智能首先建立在數據融合的基礎上。
以辯論項目為例,沃森化身的這位“女性”辯手,和另一位人類辯手就“是否應該把體育博彩合法化”的議題展開辯論時,能在聽懂人類長達4分鐘的快速陳述(700—900個單詞)后,進行迅速反應,搜集資料、選取角度,給出旁征博引的辯駁;在短兵相接的短辯交鋒中也能很快理解對方的觀點、組織語句并做出有針對性的論述。
蘇萌表示,數據目前來看仍然是人工智能的基石。不久前,德國商業軟件巨頭SAP以80億美元收購全球最大在線調查公司Qualtrics,說明了數據融合的重要性。2017年,百分點也并購了中國最大的在線調研服務商極速洞察,使得百分點同時擁有高達380萬的中國最大用戶樣本庫,將雙方的行為數據和態度數據進行融合。
數據融合包括擁有海量數據和實現高效融合兩方面。
蘇萌表示,數據融合指的是打破業務系統的煙囪融合海量的多元異構的數據,它既是一次企業內外部數據的融合,也是大小數據的融合,同時也是歷史數據和實時數據的融合,只有數據融合了之后,才能洞見真相避免偏見,才能明智決策避免武斷。
“知識圖譜是我們讓機器去了解、認識人類世界的核心,它把我們的知識構建成網狀的知識結構,再通過人機交互直接輸出。”蘇萌進一步解釋,數據融合意味著知識需要不斷更新,但在更新一個知識點的時候往往需要更新整個知識系統,操作非常繁瑣。
“出版行業或者媒體,甚至公安行業,所涉及的知識都需要實時動態理解,某一個知識不是固定不變的,所以知識圖譜未來的發展方向是動態知識圖譜。” 蘇萌解釋,這個世界由很多的東西構成,比如人、事、地,這些可以理解為本體,本體發生變化或者本體間的關系發生變化后,動態知識圖譜能夠迅速自動重構,高效地實現對一個行業的知識圖譜的構建。
攻堅在路上,來自小數據的挑戰
新的領域、沒有海量樣本、訓練速度不夠,是不是每遇到一個特殊場景,都要重新建模,輸入大量的樣本讓機器重新學習一次呢?條件并不允許。
“很多客戶的實際應用場景是數據量不夠甚至是比較少的,在這種情況下我們結合遷移學習技術,解決了小樣本的模型訓練問題,標注量只有以往的10%。”百分點首席算法科學家蘇海波說。
從小數據中獲得學習能力,也是人工智能走向認知智能的一個重要部分。人工智能專家經常用貓舉例:小孩子認得貓只要指給他看一兩次就夠了,AI卻需要成百上千張圖片,才能掌握貓的特征。
為此,人工智能科學家嘗試結合遷移學習開發一系列算法,節約人工標注樣本的時間,讓模型在少量的標注數據上,也能取得好的效果,可以理解為賦予AI“舉一反三”的能力。“例如像電商評論情感分類這樣一個任務,用傳統的深度學習模型需要數萬條數據才能達到85%左右的效果,但是如果采用深度遷移學習技術,數百條數據就能達到同樣的效果。”蘇海波說,我們判斷認知智能未來會迎來黃金十年的發展,為此百分點成立了認知智能實驗室。除了深度遷移學習技術,實驗室還會重點研發多語種自然語言處理技術,幫助認知智能實現跨種族、國際化。
“未來我們會與各大高校和研究機構開展合作,建立聯合實驗室,共同探索更多前沿的認知智能技術,包括各個重點行業的知識圖譜構建、自動問答等等。基于這些技術,實驗室會研發出更多行業落地的應用產品,為客戶創造價值,用認知智能推動社會進步。”蘇海波說。(張佳星)
關鍵詞:
凡本網注明“XXX(非中國微山網)提供”的作品,均轉載自其它媒體,轉載目的在于傳遞更多信息,并不代表本網贊同其觀點和其真實性負責。
大眾網·海報新聞記者張穩呂樂田陽孫震泰安報道時值深秋,泰安市邱家店鎮姚家坡村迎來了一年中最忙碌的時節——作為全國最大的“秋褲村”,每
2022-10-29 18:34
在中國,每12秒有1人發生卒中,每21秒有1人死于卒中,腦血管病已成為中國居民第一位的死亡原因,早期預防顯得尤為重要。每年10月29日是“世界
2022-10-29 18:39
10月28日上午,全國首個航運企業集成化審批服務平臺在青島自貿片區啟動。該平臺運用數據中臺、AI人工智能、電子簽名等技術,將涉及水路運輸、
2022-10-29 18:37
海報評論員朱延魯10月28日,山東公布了2022年前三季度全省經濟運行數據。根據地區生產總值統一核算結果,前三季度,全省生產總值為64409億元,
2022-10-29 18:31
作為正規醫院,南昌豐益肛腸醫院在改善就醫環境、降低就醫費用、優化就醫流程方面下功夫;實行的無假日醫院制度,為上班族看病提供便利;通過
2022-10-29 17:53
10月28日,山東發布了前三季度的全省經濟運行情況。前三季度全省生產總值64409億元,同比增長4 0%。跑贏3 0%的全國大盤,經濟大省山東交出了一
2022-10-29 15:41
大眾網·海報新聞記者解強民通訊員姜雁群濟南報道10月28日,濟南軌道交通3號線二期設備工程開工活動在稻香站舉行,標志著濟南軌道交通3號線二
2022-10-29 15:32
大眾網·海報新聞記者梁雯濟南報道11月9日至10日,2022全國中小企業數字化轉型大會將于山東國際會展中心舉行。本次大會主題為“創新引領發展數
2022-10-29 15:36
大眾網·海報新聞記者孫杰濟南報道10月28日,由中國聯合國協會主辦、外交部國際司支持、山東大學承辦的第十八屆中國模擬聯合國大會開幕。此次
2022-10-29 15:42
測評每天護膚一小步變美就更進一步啦,因為對于好肌膚,我們不管是化妝還是素顏都會顯得好看,今天想和大家分享一下本人親自測評護膚品--鄭
2022-10-29 14:12