書架 | 搜作品
記住網址:luquw.cc,最新小說免費看

科學的邏輯 免費全文 碳原子516 最新章節 牛頓,薛定諤,維數

時間:2016-11-22 15:58 /進化變異 / 編輯:米琪
經典小說《科學的邏輯》由碳原子516傾心創作的一本進化變異、末世、技術流型別的小說,本小說的主角疊加態,維數,牛頓,內容主要講述:數學和語言學在很偿一段歷史時期裡沒有多少尉集...

科學的邏輯

作品長度:短篇

作品歸屬:男頻

《科學的邏輯》線上閱讀

《科學的邏輯》第38篇

數學和語言學在很一段歷史時期裡沒有多少集,它們沿著各自的軌跡發展著,直到計算機科學的興起,才逐漸將它們融起來。農的經典作品《通訊的數學原理》為用數學方法,其是數學中的機率論方法來分析和處理資訊的有關問題提供了理論平臺,特別是資訊熵概念的引入,為我們從數學和機率的角度理解資訊成為可能。而語言是資訊的一種載,通常情況下,我們都是透過語言來傳遞和理解資訊的,這就為用數學方法處理語言問題找到了一條全新的路。

語言可以以不同種類的文字或字的形式存在,也可以透過說話來表達,但這些不同的方式可以用來傳遞相同的資訊,透過這些表象,我們可以理解到這些隱藏在不同外下的相同資訊。資訊這種表述上的多樣化和靈活,讓我們看到了不同文字或語音之間相互翻譯的可能。計算機可以速處理大量資訊,因此藉助計算機行語言文字或語音的處理,或者實現不同資訊載之間的速機器翻譯,是一種很有景的方法。

早期用計算機對語言行處理時,由於沒有注意到語言背的資訊本質,而只關心每種語言總結出來的語法規則,由於語法是一種經驗的東西,沒有多少內在的規律,不同語言的語法差異很大,因此在這方面走了很多彎路,建立在這種思維基礎上的機器翻譯和自然語言處理效果很差,難以走出實驗室成為實用的產品。現在我們知,資訊並不是隱在語法之中,而是隱在符號或者語音的機率分佈之中,這從農經典的資訊熵公式中可以會到。這樣,對自然語言行處理和運算的方式發生了明顯的化,從當初的語法規則轉為如今的機率統計模型,並迅速取得了許多重要的突破,一些有實用價值的處理自然語言的件或產品也走出實驗室,獲得了大量現實應用。

許多現實問題的難度在它的正反兩方面存在不小的差異,例如將文字轉化為語音是容易的,一個漢字通常只有一種讀音,多音字很少,但是將語音轉換成文字則難了許多,同一個音一般有許多漢字。為解決這類問題,透過引入機率模型,就可以以很高的準確率實現語音識別,並轉換為文字。這是因為,雖然一個音往往對應許多漢字,但是與之相鄰的漢字與之一起出現的機率是大不一樣的。就像“語言”這個詞,當我們知第一個字是“語”的時候,面那個字是“言”的機率要大的多,透過這種機率模型,幾乎不可能將這個詞識別成“語炎”。機器翻譯也是這樣,如今的自然語言處理已經建立起了標準語言資料庫,每個字在文章中出現的機率,以及相鄰的字詞之間出現的機率都有了標準化的數值。有了這些機率,我們就可以將這篇文章數字化,首先透過一定的演算法對一篇文章行分詞,並對每個詞分一個標準語言庫中的機率,這樣,一篇文章成了一串按照一定次序排列好的機率,這在數學上相當於某個數學空間中的向量。透過機率匹和與相鄰字詞同時出現的機率行匹和計算,也就可以推算出為描述這組資訊,在另一個語種中,是什麼樣子,這樣就實現了不同自然語言之間的機器翻譯。

通常情況下,資訊隱在字詞出現的機率分佈之中,因此上下文之間的關聯對理解資訊很重要。但是有時上下文之間相聯絡的跨度會很大,為描述這種機率分佈所需要的計算量也會急劇增大。為避免這種情況,一般需要引入一個常用的簡化假設:馬爾科夫鏈。也就是說,我們假設每個字詞只與和它相鄰的字詞存在關聯,而與更遠的字詞沒有關係。這一假設儘管稍稍降低了機器翻譯的準確度,卻大幅度的簡化了計算模型和計算量,使基於統計語言模型的機器翻譯效果遠遠超出傳統的翻譯方法。機器翻譯在統計分析的基礎上,透過人工智慧方法行強化學習,可以不斷最佳化演算法。隨著大資料時代的到來,訓練得到的演算法也越來越優秀,機器翻譯的結果也越來越專業。如今的同聲傳譯系統已經非常專業,由於中英文的語序一般不太相同,甚至當某個中文詞還沒有說到時,同聲傳譯系統做出的英文翻譯就已經出來了。

將字詞這樣的語言學物件作為數學物件來看待是一種新穎的想法,透過分詞和機率化,一篇文章轉換成了一個數學向量。而在數學領域,對向量行處理和運算的數學工非常多,這也為用數學思路解決語言學問題提供了大量新的方法。例如,我們往往需要將大量不同的文章行分類,有些屬於小說,有些屬於歷史,有些則是科學專著,這在從,需要許多有經驗的人透過閱讀和判斷行人為分類,費時費,效率低下。而從數學角度看,這些文章都是在某個抽象的數學空間中的向量或座標點,如果某些向量之間角很小,其座標點就會離得很近,它們就是同一型別的文章,反之,如果向量之間角很大,說明它們是不同領域的內容。而在數學上計算向量角是很容易的,只需要計算兩個向量的內積和各自的度就可以了。這樣,就可以用計算機演算法對大量文章行迅速有效的分類。數學的方法還可以應用到語音識別和影像識別之類的領域,我們可以透過數學計算的方式分辨哪句話是哪個人說的,哪幅畫是哪個人畫的,也可以在遍佈各地的攝像頭採集的海量資料中,迅速準確的識別出某個逃犯等等。數學語言學儘管已經碩果累累,但它還很年,在未來還會有更多應用和驚喜等著我們,相信方的風景會更加好看。

(38 / 59)
科學的邏輯

科學的邏輯

作者:碳原子516
型別:進化變異
完結:
時間:2016-11-22 15:58

相關內容
大家正在讀

本站所有小說為轉載作品,所有章節均由網友上傳,轉載至本站只是為了宣傳本書讓更多讀者欣賞。

Copyright © 2026 鹿趣小說網 All Rights Reserved.
(臺灣版)

聯絡途徑:mail

鹿趣小說網 | 當前時間: