通用模型化

概述

我還沒找到一個合適的詞匯來描述這個概念,姑且先叫模型化,世界模型是通用智能的核心能力,掌握世界模型,根據實時感知數據立即構建世界模型,并運用世界模型相關的知識和操縱手段即可預測未來,并能及時修正模型。
通用智能的以世界模型為中心的基本流程:
觀察未知事物->發現規律->建立世界模型,形成相關的知識和操縱手段->基于感知線索召回世界模型,根據狀態進行推理預測、目標求解。

模型化與數字化和結構化的關系

模型化是數字化和結構化中間的一個通用形態
數字化是最初級的信息化手段,物理世界通過傳感器編程二進制就算最簡單的數字化,當然從數字化這個術語的使用來看,大家往往認為數字化包含了一切信息化手段,我們成為廣義的數字化,即計算機處理的一切手段都是數字化手段,因而是包含智能化、結構化這些東西的,是最大的一個圈。狹義的數字化,我們認為就是將沒有變成數據的東西變成任意維度的數據就算了,比如文字、圖像、視頻,這些已經算作狹義的數字化了。
引入智能化之后,就等于引入了算法、計算和處理過程,不能單純地看數據的存儲形態,而要關心其語義、內涵和結構化層級了。
結構化是一個具備非常抽象意義的詞匯,即讓事物組織的條理有序呈現出清晰結構的方法。結構是一個復雜的詞匯,他主要跟組合、關系、構成方式這些含義緊密相關,從通用智能理論上看,他是世界模型的核心組成部分,如語言學中的frame、視覺上的布局、聽覺上的和弦構型等等,世界模型的核心構成是概念(包括關系型概念(包括復雜結構概念)),從而衍生出實體、關系(復雜關系亦即結構)、屬性用于高級思維的推理預測所使用。
實體關系屬性的根在完形化,完形化只是人類智能的符號控制的基礎,不是全部智能的控制基礎,比如條件反射、大量的運動控制是不依賴完形化的。
通過上面的討論我們更加清晰,結構化與模型化的大致關系了,兩者不是一個等級的概念,結構是隸屬于模型的子范疇概念。

Read more

Yoshua Bengio訪談筆記:用意識先驗糅合符號主義與聯結主義

本文轉載自機器之心 作者:邱陸陸。

這篇文章極好地闡釋了AI先驅們對通用智能的理解,Bengio不愧為一代大師。感謝機器之心如此專業的分享,也感謝Bengio引領我們走向正確的方向,他所提到的幾件重要的事情都體現了他對人類智能深刻的理解。1. 世界模型。無意識狀態中存儲了海量的關于世界的知識、關系、信息,智能始終基于對世界的理解來進行推理預測。 2. 符號化,我稱之為離散化或完形化,從復雜感知數據,海量特征中涌現單一整體的過程,是聯結主義和符號主義的橋梁,由于離散化的存在,連續的變化的數據才變成了單一、離散的表征,我們才能進行程序化的計算、推理,這也是我下一個要提到的圖靈機制的關鍵所在。3. 圖靈機制。Bengio所提的意識State恰恰說明他意識到了大腦中圖靈機制的存在,意識State就是運行時的世界模型,從記憶中提取的世界知識,借助感知數據,我們在意識活動(注意和工作記憶)下建立運行時的世界模型,并進行推演從而做出準確的預測。正因為有了這樣的理解,我們才能夠自信地認為BERT的基于概率的方向是存在明顯問題的,至少他不是人腦運作的方式。我們應該結合神經網絡的海量表征潛在常識與自然語言的數據,共同來筑建運行時模型,才能做出最準確的對語言的理解,才能進行推理和解決問題。對此Bengio非常謙虛地表示,在這個框架下未來將有很多工作要做,是一種非常務實的心態,如何訓練出我們想要的海量無法用言語來形容的,對意識層面或者完形、離散化有益的表征,將是下一步研究課題。

 

表征(representation)空間的依賴貫穿計算機科學乃至日常生活的始終。在計算機科學中,如果數據有精當的結構,輔以智能化的索引,那么搜索任務的速度可以指數級加快;對于人來說,計算『 210 除以 6 等于幾?』是容易的,計算『 CCX 除以 VI 等于幾?』則需要更多時間。表征空間的選擇對機器學習算法的性能影響,由此可見一斑?!埂渡疃葘W習》[1] 一書如是評價表征的重要性。 Read more

The Development of Movement – Stages

By Dr Emmi Pikler

An excerpt PEACEFUL BABIES – CONTENTED?MOTHERS (published in 1940),
taken from the Sensory Awareness?Foundation publication BULLETIN (Number 14/Winter 1994).

Children,?particularly in cities, tend to sit poorly and have bad posture. They cannot?sit, stand or walk properly, not to mention more complicated movements.

This,?of course, is not self-evident to every reader.??I can hear the astonished responses: “What? My children can’t move?!”?“My little daughter could already sit when she was just?four months old”??“Mine was already standing at six months”…?“When my son was not even one year old, he was walking.”
Read more

生成查詢網絡(GQN)的論文翻譯——場景的神經表征與渲染 Neural scene representation and rendering

本文對Deepmind最新成果GQN論文的主要部分進行了翻譯

場景的神經表征與渲染 Neural scene representation and rendering

S. M. Ali Eslami, Danilo Jimenez Rezende, Frederic Besse, Fabio Viola,
Ari S. Morcos, Marta Garnelo, Avraham Ruderman, Andrei A. Rusu, Ivo Danihelka,
Karol Gregor, David P. Reichert, Lars Buesing, Theophane Weber, Oriol Vinyals,
Dan Rosenbaum, Neil Rabinowitz, Helen King, Chloe Hillier, Matt Botvinick,
Daan Wierstra, Koray Kavukcuoglu, Demis Hassabis

 

摘要

場景表征——將視覺感受數據轉換成簡要描述的過程——是智能行為的一個基礎。近來的研究表明,當提供足夠大的標簽數據時,神經網絡在此方面表現優越。然而如何避免對標簽的依賴依然是個開放性問題。鑒于此,我們開發了產生式查詢網絡(Generative Query Network, GQN),在該框架內機器可以只依賴自己的感受器來學習表征。GQN接受從不同視角拍攝的場景圖片作為輸入,構建內部表征并使用該表征來預測從未觀察過的視角的場景圖像。GQN做到了不依賴標簽或領域知識的表征學習,向機器自動學習理解世界又邁進了一步。

Read more

智能時代與互聯網時代創業差異

智能時代得創業窗口期將變短,超級公司誕生得可能性巨大,但在通用智能技術達到臨界點之前,一定程度上的領域細分依然是人工智能創業的主旋律,超過臨界點之后,大多數競爭者將被淘汰,且越甩越遠。

互聯網時代還難以進入寡頭壟斷,整個三十年的創業期內各類互聯網公司風起云涌,主要的原因是數據的產生和數據的結構化是個體力活,很多公司僅僅憑借數據生成(算法生成和人工生成)和數據結構化就能活得滋潤,更不要說建立在數據之上的算法積累了,領先優勢更鞏固了互聯網垂直創業者在各自行業得地位。

智能創業得變革機會要比互聯網更多,因為不是所有得行業都需要互聯網化,但所有得行業都會面臨智能化,兩者已經不是一個量級。

智能化的路徑是專用向通用演變的過程,也是從眾多垂直創業者向一家獨大演變的過程。誰得到更通用的智能技術,誰就得到更進階的密匙。

僅有互聯網無法實現共產主義,只有人工智能才能實現終極生產力。

股票、期權、合伙人和員工

他到底是合伙人還是員工?

這是不同的概念,合伙人分的是股份,員工理論上只分期權,所以這個事件的本質是雙方的角色分歧,CEO把他當員工看,他把自己當合伙人,而這個角色應該在創業開始時就應該說清楚。

如果你創業想找一個人給你出技術,那么你要分清楚一件事兒,你是讓他幫你熬過創業初期還是持續管理公司,前者決定你必須找一個員工,后者才決定你找一個合伙人,合伙人分的是股份,這個股份的價值在于長期性的認可,直接給股份是十分高風險的事情,很多創始人耍機靈,開始時玩模糊戰略,等過了兩年看清楚了,再決定你的角色問題,就會出現分歧和糾紛。

期權和限制性股權的性質比較相似,都是依賴過去貢獻的股權授予機制,是一種按勞分配對抗不確定性的優良機制,所以適用于公司的大部分員工,用于獎勵員工過去的努力,注意到沒有,這個事件里面就有一段話在講這個問題,你過去的努力,我已經給我你分紅,未來的得看你的表現,這就是對待員工的態度,如果你合伙人,是創始股東,大家就是兄弟,要坐在一起商量,性質是截然不同的,就算你已經不在公司了,你依然是股東,你依然可以享受公司的分紅,就像上市公司的大眾股東,誰也不同跑去給公司打工,不照樣可以享受分紅?這就是股權的威力,股權決定了你對公司的擁有權比例而且不用打工就可以獲取相應收益的權利。

說到這里,順便提一下代持,一種對普通員工分配具有無投票性質的股權的辦法,這樣既保持了管理層的控制力,也保證了大家的努力得到的應當的現金收益。

那么實際上還是有第三種人存在的,比如職業經理人,他既不是創始股東和創始團隊的成員,但又是公司重要的管理團隊成員,其實是半員工半合伙人性質,這樣的人,一般情況下,可能會授予一定的股權,再授予一定的期權,給股權代表著我請你來,是把你當朋友,當兄弟,一起奮斗,給期權,代表著,我還是不是完全信任你,你還要通過表現拿剩下的部分。

但無論是怎樣的角色定位,作為創始人都應該在決定與一個人一起共事時,就應該把這個事情理清楚,說清楚,期權是應對概率問題的重要手段,當你對對方的確心有顧忌的時候,就應該明確的說出來,對不起,我不能直接給你股權,我只能給你期權,有部分信任的時候,可以說,我可以給你1%的股權,剩下4%必須是期權,等等。

打馬虎眼藏心眼的行為是不負責任的,嚴重的話就是詐騙。

所以總的來說,創始人首先應該理清楚目標人物的角色和不確定性問題,這樣才能結合時間維度、貢獻維度和控制維度,組合生成相應的股權期權方案。

使用.ai域名的著名人工智能創業公司盤點

.com域名基本已經廢了,除非特別討巧地起到新的名字,否則基本都要花大價錢才能搞到滿意的名字。但這些對于人工智能的初創公司,似乎煩惱更小一點,因為.ai域名的注冊價格不菲,導致投機者大幅減少,直到2015年,.ai域名都數量甚微,大量優質域名都無人注冊,比如單拼ai域名今年才用盡,而雙拼域名大把存在,因此這些人工智能初創公司,就可以開開心心地毫無壓力地選擇一個比較不錯的域名注冊。

Read more

類人智能系統的十四個關注點

5C39EE93-6D18-4C0B-A8EB-F7981CE7F7FE

作為近期思考的簡單總結,列出如下十四個關注點,一個出色的智能系統需要對這些方面都有清晰明了的認識或解決方案,還有許多其他方面的因素可能沒有考慮進來,這也說明了類人智能系統的復雜性是巨大的。

一、分離性。視覺原理表明從眼球進入的神經信息就已經不是整齊劃一的,比如計算機中的圖像用坐標和RGB值,不同的神經節細胞傳遞不同類型的信息進入膝狀體,膝狀體有大細胞層、小細胞層、塵細胞層,各種細胞又分別向上傳遞不同的信息類型;除了視覺系統以外,所有的系統,都遵循分離性原則,事物的每個側面特征都是分離表述的,比如聲音的音高、音量、音色;運動的快慢、軌跡等等。
二、內部一致性。視覺傳遞的信息,還是聽覺信息,在內部都變成了隨時間變化的脈沖信號,即可以看成時間為橫軸的離散點,時間一致性散落在所有神經元中。
三、連續性。顏色、邊線、角度、空域頻率等等信息又集中在相同的視野內,至少直到視覺高層,這種原則都是得到保持的
四、去時間性。以視覺為例,眼球的快速運動使得不同位置的信息源源不斷地流入大腦,在大腦中不同位置的信息不是在同一時刻到達,而是連續不斷地到達,所以傳統的機器學習的靜態處理手段顯然不符合大腦的處理原則。通過短時記憶,跨時間的綜合特征分析才是王道。 Read more

我的人工智能路線

最近的一些進展我們可以看到,無論是人腦中的位置神經元的發現,還是所謂的小樣本學習能力——向人類一樣學習寫字,包括我們越來越多的看到家庭機器人的創業公司,越來越多的關于人工智能和機器人的科技博客,比如新智元、機器之心,當然也包括,馬斯克創建的人工智能安全控制聯盟(OpenAI),大家對于AI的關注度正在不斷上升,現在似乎就等待那一個剎那,一個臨界點了。
這個技術爆發點將出現在哪里?是DeepMind?是Deep Learning?是歐腦計劃?還是百度大腦?是谷歌,還是微軟?是MIT還是斯坦福?一切不得而知,但對于我而言,一切很清晰,我不是民科,也不是科學家,不相信可以以一己之力突破世紀難題,就算提出了可能的理論模型,也未必有可行的計算力支撐,當下的愿望便是希望整個世界的進度再快一些,最好能有更多有價值的成果出現,尤其是關鍵性成果的出現,這樣,我們便可以借助新的思路,快速突破現有的智能局限,迎接全新的智能技術革命。

參考鏈接:

http://tech.sina.com.cn/d/i/2015-12-12/doc-ifxmpnqi6368668.shtml
http://it.sohu.com/20151212/n431026627.shtml

河北彩票20选5开奖查询