簡介
Eureqa程式可以幫助科學家從原始資料裡面提煉出科學的規律。而且這個程式是免費的,所有研究員都可以擁有它。 這個程式在2009年四月的時候被揭開了面紗。它被用來讀出一個雙擺的數據,這個數據是用來推斷出牛頓的第二運動定律以及動量守恆定律。
可以說,這個工具是無價的。它可以幫助人們揭示那些更加複雜的科學規律。而且這些科學規律常常無法被人類發現。現在科學家們都非常想獲得這個工具。 這個程式正在調整電子管,為了把不同的有營養的東西和毒素都放到細胞內來分析。並且,它能做得比研究員快多了,威克斯沃說,它會以方程式的形式程式結果,同時在告訴研究員還需要的數據。
威克斯沃用Eureqa程式研究了白細胞上古柯鹼的效果。根據威克斯沃所說,Eureqa程式分析數據後,可以給研究員提出他們很難想到的實驗。
背景
許多科學領域裡,除了一個變數外,你嘗試把任何東西都變成恆量。你可以一次旋轉一個按鈕,然後看這個系統怎么運作。這就是直線系統的神奇之處。但是,大部分的生物學都很複雜,並且不是線性系統。突發的情況是很難理解和應對的,你就不能只是簡單的旋轉一個按鈕,你可能要同時旋轉許多才能看到這個系統如何運作。但是,如此複雜的狀況,你只能讓Eureqa程式來幫你選擇和分析。
下面是埃默森·佩什(Emerson Pugh)的著名觀點:如果人類的大腦如此簡單以至於我們可以去理解。那么由於我們的大腦過於簡單,則無法處理如此複雜的東西。我認為這可以用來解釋生物學的各個方面。約翰·威克斯沃(John Wikswo)說。他是范德比爾特大學的生物物理學家。他正在自己的實驗室使用Eureqa程式。生物學的複雜性令人難以置信,同時對於許多人來說,它太複雜了以至於人們無法理解它是如何解釋各種複雜事物的。而解決這個問題的方法就是Eureqa程式。
康奈爾大學的研究小組並沒有記錄他們設計的這個程式的下載量,但是看起來這個程式正在被生物學界之外的研究者廣泛地採用。只要數據符合電子製表軟體,Eurequ程式就可以分析這些數據。
起源
Eureqa程式起源於利普森的電腦工作。他嘗試做出一個可以自動計算並且可以自我修復的機器人。這個機器人進行自我修復的數據分析方法被用來分析其他各種各樣的數據。
把科學當作尋找方程式。例如:質能等價理論,E=MC2,E能量,m為質量,C為光速。這個公式非常的簡潔,同時又能反映實質。 但是,也許有許多的理論非常複雜,然而能夠找到簡單的公式來表達,來自康奈爾大學的胡迪·利普森(Hod Lipson)說。他在康奈爾大學的計算機綜合實驗室工作。他說:雖然現在還無法達到那個程度(直接得出精確的公式),但是我們已經發展出一些方法能夠慢慢接近他們。
原理
這個程式通過尋找原始數據里的數字然後找出他們之間的關聯性,然後它會提出一系列的一次方程式來描述這些聯繫。這就是這個程式具體運行的方法。然而,最初得到的一次方程式總是失敗的,但是有些卻比較接近真實。接著,最好的那個方程式會被篩選出來。然後這個方程式將被再次檢驗,Eureqa程式將會通過數據來繼續分析。Eureqa程式會不斷重複這個過程,直到它找到有效和正確的方程式。
牛頓花了幾十年計算出來的東西,Eureqa程式卻只要在一個較好的桌上型電腦上花上幾個小時就能夠得出。利普森和其他研究人員都希望Eureqa程式能夠很好的解開數據的謎團。尤其是那些一直在挑戰著科學家的謎團數據。這對於那些在生物學領域工作的人來說無疑是個好訊息。因為染色體組、蛋白質、細胞單元信號的數據已被證明是相當難以分析的。那些數據就像謎團一樣。他們之間的聯繫似乎遵循著某些規則,然而傳統的分析和統計方法無法輕易就把這個規律揭示出來。
套用
11月的早期,利普森把Eureqa程式放到網上,讓所有科學家都可以在網上下載。因為他已經承受不了如此多的科學家不斷地讓他幫忙分析數據。與此同時,他和來自康奈爾大學的計算生物學家麥可·施密特(Michael Schmidt)一起在為Eureqa程式負責,並且在不斷發展和完善它。
許多令人費解卻有意義的發現來自於Eureqa程式分析得出的結果。它能分析由郭爾·蘇(Gurol Suel)收集的細胞讀數。蘇是來自西南部德克薩斯大學的一名分子微生物學家,他研究細胞如何分化和生長。蘇表示:即使Eureqa程式還不能完全解釋我們找到的數據,但它仍然非常有用。
在過去的幾年時間裡,人們因為他們那些非常瘋狂的設計理念而聯繫我們。施密特(schmidt)說道,這些想法從“預測股票市場”到“對奶牛的叫聲類型進行分類”,各種點子不盡相同。
影響
一個正在發生的挑戰就是Eureqa程式將會讓方程式符合數據,但是它會隨著變數而改變,所以這些方程式不是那么好理解。利普森把這個挑戰比喻為:如果時光倒流,科學家們把能量守恆定律展現給中世紀的數學家,這會發生什麼呢?
大家都知道代數學。你可以加上變數,然後它就可以得出答案。但是能量的概念就不是這樣。他們沒有辭彙讓你更好的理解。他說。在實驗室看到過這些。Eureqa程式能找到一些新的聯繫。這是預言性的,而且非常精確。這可能是對的。但是也可能我們完全不知道這是什麼意思。
利普森和施密特現在還在設計:運算法則可以解釋通過運算法則發現的東西。它可能是通過把未知的概念與更加相似、更加簡單的類別聯繫起來。如何把一些複雜的東西解釋給孩子聽呢?這就是問題的關鍵。這就像是機器在進行教學,而不是機器在學習。
有時,Eureqa程式需要更多的數據來尋找答案。在一些案例里,這個程式可以區分出信息的空白點,然後推薦一些實驗來完善這些信息。利普森的Eureqa程式也在不斷的改善。