且還必須是“活到老,學到老”。而機器那艾儀器學習卻 能以 驚人 的速度 進行,并 且機器 不會 疲倦、不 用休息,因此其學習速度是人類所無法比擬的。 人類的知識不具有繼承性,而機器的知 識可以 具有 繼承 性。人類 的生命 年限 對人 們的 學習是一個極大的障礙。一個人一生可能積累了很多知識,但一旦生命結束,這些知識也就 隨之消失了,他不能將其已經掌握的知識傳遞給他的子孫,使他的子孫在他已有的知識上繼 續發展,他的子孫要想擁有他已有的知識,還必須花十幾年的時間從頭再學。隨著社會和科 學技術的進步,知識以爆炸的形式增長,這就會使 一個 人的學 習時 間越 來越長,這 其實 是對 生命的一種浪費。如果計算機具有學習的功能,就可以把學習不斷地延續下去,避免大量的 重復學習,使知識積累達到新的高度。 利用機器學習有利于知識的傳播。對于人類來說,一個人通過一輩
子的學習,已經擁有 大量的知識,但他無法 讓其 他 人擁 有和 他一 樣的 知 識,其他 人必 須從 頭學 起。而 對 于計 算 機,只要有一臺機器“學會”了,其他機器只要簡 單地“復制”一 下也 就“學會”了,非 常容 易實 現知識的快速傳播。 綜上所述,機器學習速度快、便于知識積累、學習結果易于傳播,因此人類在機器學習領 域的每一點進步,都會使計算機的能力顯著增 強,從而 對人類 社會 產生 影響,尤其 對今 天信 息化社會來說,這種影響將是十分深遠的。 6.1.3 機器學習的發展史 自從20世紀50年代開始研究機器學習以來,經過了幾個不同的發展時期,若以它們的 研究目標和研究方法來劃分,可以分為四個階段。其研究內容分別為:神經元模型和決策理 論;符號概念獲取;知識增強和論域專用學習;連接學習。 1. 神經元模型和決策理論的研究 這一階段始于20世紀50年代中期,主要研究目標是應用決策理論的方法,研制各類自 組織的、自適應的通用學習系統。這類系統 實際上 可以 稱為 神經網 或自 組織系 統。它 的基 本思想是:系統是一個由互連的元件組成的網 絡,網絡 結構可 能是 任意 的,這 些元 件類 似于 神經元;如果給系統一組刺激、一個反饋源和修改 自身 組織的 自由 度,那么系 統就 可以 自適 應地趨向最優化。 這類學習系統的典型代表有 F.Rosenblatt提出的感知器模型,它由閾值性神 經元組成, 試圖模擬動物和人的感知及學習能力。 2. 符號概念獲取研究 這一階段始于20世紀60年代中期。本階段 的研 究目標 是模 擬人 類的概 念學 習過程, 6.1 概 述 213 并采用邏輯結構或圖結構作為機器的內部描述。
研究者們力圖在高層知識符號表示的基礎 上建立人類的學習模型,使機器能夠采用符號來描述概念(符號概念獲取),并提出關于學習 概念的各種假設。本階段的代表 性工 作有 Winston的 結構 學習 系統 ARCH 和海 葉 斯- 羅 斯(F.Hayes-Roth)等 的基 于 邏輯 的 歸納 學 習 系 統。雖 然 這 類 學習 系 統 取 得 了較 大 的 成 功,但只能學習單一概念,并且未能投入實際應用。 3. 知識增強和論域專用學習 這一階段始于20世紀70年代中期。這一階段對機器學習的研究從學習單個概念擴展 到學習多個概念,探索不同的學習策略和各 種學習 方法。 機器學 習過 程一般 都以 大規 模知 識庫為背景。學習系統中包括預先確定的概念、知 識結 構、論 域約 束、啟發式 規則 和論 域有 關的變換。系統在開始時并不具有所有的屬性或 概念,但 在學習 過程 中系統 將會 得到 一些