&

大數(shù)據(jù)翻譯英語常用詞匯總結(jié)之二當(dāng)前位置：首頁 > 翻譯知識

大數(shù)據(jù)(big data,mega data)或稱巨量資料，指的是需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數(shù)據(jù)時代》中大數(shù)據(jù)指不用隨機分析法(抽樣調(diào)查)這樣的捷徑，而采用所有數(shù)據(jù)進行分析處理。大數(shù)據(jù)的5V特點:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值密度)、Veracity（真實性）。隨著人工智能的大量應(yīng)用，大數(shù)據(jù)翻譯也應(yīng)用廣泛起來，下來海歷陽光翻譯公司簡單總結(jié)一些大數(shù)據(jù)的常用詞匯。

IT翻譯.jpg

??二十六：CPA（廣告術(shù)語）

??CPA（Cost Per Action）是一種廣告計費模式，顧名思義按照行為（Action）作為指標(biāo)來計費，這個行為可以是注冊、咨詢、放入購物車等等。廣告公司和媒體公司常用CPA、CPC(Cost Per Click)、CPM(Cost Per Mille，或者Cost Per Thousand;Cost Per Impressions)一起來衡量廣告價格。

??CPA（每次行動成本，Cost Per Action）計價方式是指按廣告投放實際效果，即按回應(yīng)的有效問卷或定單來計費，而不限廣告投放量。CPA廣告是網(wǎng)絡(luò)中最常見的一種廣告形式，當(dāng)用戶點擊某個網(wǎng)站上的cpc廣告后，這個站的站長就會獲得相應(yīng)的收入。

??二十七：CPT（廣告術(shù)語）

??按時長計費是包時段投放廣告的一種形式，廣告主選擇廣告位和投放時間，費用與廣告點擊量無關(guān)。采用這種方式出售廣告，網(wǎng)站主決定每一個廣告位的價格，廣告主自行選擇購買時間段，目前可按周或按天購買，成交價就是網(wǎng)站主標(biāo)定的價格。

??二十八：CTR（廣告點擊率）

??CTR（Click-Through-Rate）互聯(lián)網(wǎng)廣告常用的術(shù)語，指網(wǎng)絡(luò)廣告（圖片廣告/文字廣告/關(guān)鍵詞廣告/排名廣告/視頻廣告等）的點擊到達率，即該廣告的點擊量（嚴格的來說，可以是到達目標(biāo)頁面的數(shù)量）除以廣告的瀏覽量（PV- Page View）。

??CTR是衡量互聯(lián)網(wǎng)廣告效果的一項重要指標(biāo)。

??二十九：算法

??算法（Algorithm）是指解題方案的準(zhǔn)確而完整的描述，是一系列解決問題的清晰指令，算法代表著用系統(tǒng)的方法描述解決問題的策略機制。也就是說，能夠?qū)σ欢ㄒ?guī)范的輸入，在有限時間內(nèi)獲得所要求的輸出。如果一個算法有缺陷，或不適合于某個問題，執(zhí)行這個算法將不會解決這個問題。不同的算法可能用不同的時間、空間或效率來完成同樣的任務(wù)。一個算法的優(yōu)劣可以用空間復(fù)雜度與時間復(fù)雜度來衡量。

??三十：機器學(xué)習(xí)

??機器學(xué)習(xí)(Machine Learning, ML)是一門多領(lǐng)域交叉學(xué)科，涉及概率論、統(tǒng)計學(xué)、逼近論、凸分析、算法復(fù)雜度理論等多門學(xué)科。專門研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為，以獲取新的知識或技能，重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。

??它是人工智能的核心，是使計算機具有智能的根本途徑，其應(yīng)用遍及人工智能的各個領(lǐng)域，它主要使用歸納、綜合而不是演繹。

??三十一：人工智能

??人工智能（Artificial Intelligence），英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計算機科學(xué)的一個分支，它企圖了解智能的實質(zhì)，并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機器，該領(lǐng)域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來，理論和技術(shù)日益成熟，應(yīng)用領(lǐng)域也不斷擴大，可以設(shè)想，未來人工智能帶來的科技產(chǎn)品，將會是人類智慧的“容器”。

??三十二：深度學(xué)習(xí)

??英文名：Deep Learning

??深度學(xué)習(xí)的概念源于人工神經(jīng)網(wǎng)絡(luò)的研究。含多隱層的多層感知器就是一種深度學(xué)習(xí)結(jié)構(gòu)。深度學(xué)習(xí)通過組合低層特征形成更加抽象的高層表示屬性類別或特征，以發(fā)現(xiàn)數(shù)據(jù)的分布式特征表示。

??深度學(xué)習(xí)的概念由Hinton等人于2006年提出。基于深信度網(wǎng)(DBN)提出非監(jiān)督貪心逐層訓(xùn)練算法，為解決深層結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來希望，隨后提出多層自動編碼器深層結(jié)構(gòu)。此外Lecun等人提出的卷積神經(jīng)網(wǎng)絡(luò)是第一個真正多層結(jié)構(gòu)學(xué)習(xí)算法，它利用空間相對關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能。

??深度學(xué)習(xí)是機器學(xué)習(xí)研究中的一個新的領(lǐng)域，其動機在于建立、模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)，它模仿人腦的機制來解釋數(shù)據(jù)，例如圖像，聲音和文本。

??三十四：神經(jīng)網(wǎng)絡(luò)

??人工神經(jīng)網(wǎng)絡(luò)（Artificial Neural Networks，簡寫為ANNs）也簡稱為神經(jīng)網(wǎng)絡(luò)（NNs）或稱作連接模型（Connection Model），它是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征，進行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度，通過調(diào)整內(nèi)部大量節(jié)點之間相互連接的關(guān)系，從而達到處理信息的目的。

??三十五：OpenStack

??OpenStack是一個由NASA（美國國家航空航天局）和Rackspace合作研發(fā)并發(fā)起的，以Apache許可證授權(quán)的自由軟件和開放源代碼項目。

??OpenStack是一個開源的云計算管理平臺項目，由幾個主要的組件組合起來完成具體工作。OpenStack支持幾乎所有類型的云環(huán)境，項目目標(biāo)是提供實施簡單、可大規(guī)模擴展、豐富、標(biāo)準(zhǔn)統(tǒng)一的云計算管理平臺。OpenStack通過各種互補的服務(wù)提供了基礎(chǔ)設(shè)施即服務(wù)（IaaS）的解決方案，每個服務(wù)提供API以進行集成。

??三十六：SaaS

??SaaS是Software-as-a-Service（軟件即服務(wù)）的簡稱，隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和應(yīng)用軟件的成熟，在21世紀開始興起的一種完全創(chuàng)新的軟件應(yīng)用模式。它與“on-demand software”（按需軟件)，the application service provider(ASP，應(yīng)用服務(wù)提供商)，hosted software(托管軟件)所具有相似的含義。它是一種通過Internet提供軟件的模式，廠商將應(yīng)用軟件統(tǒng)一部署在自己的服務(wù)器上，客戶可以根據(jù)自己實際需求，通過互聯(lián)網(wǎng)向廠商定購所需的應(yīng)用軟件服務(wù)，按定購的服務(wù)多少和時間長短向廠商支付費用，并通過互聯(lián)網(wǎng)獲得廠商提供的服務(wù)。

??三十七：Paas

??PaaS是Platform-as-a-Service的縮寫，意思是平臺即服務(wù)。把服務(wù)器平臺作為一種服務(wù)提供的商業(yè)模式。通過網(wǎng)絡(luò)進行程序提供的服務(wù)稱之為SaaS(Software as a Service)，而云計算時代相應(yīng)的服務(wù)器平臺或者開發(fā)環(huán)境作為服務(wù)進行提供就成為了PaaS(Platform as a Service)。

??所謂PaaS實際上是指將軟件研發(fā)的平臺（計世資訊定義為業(yè)務(wù)基礎(chǔ)平臺）作為一種服務(wù)，以SaaS的模式提交給用戶。因此，PaaS也是SaaS模式的一種應(yīng)用。但是，PaaS的出現(xiàn)可以加快SaaS的發(fā)展，尤其是加快SaaS應(yīng)用的開發(fā)速度。在2007年國內(nèi)外SaaS廠商先后推出自己的PAAS平臺。

??三十八：IaaS

??IaaS（Infrastructure as a Service），即基礎(chǔ)設(shè)施即服務(wù)。

??消費者通過Internet 可以從完善的計算機基礎(chǔ)設(shè)施獲得服務(wù)。這類服務(wù)稱為基礎(chǔ)設(shè)施即服務(wù)。基于 Internet 的服務(wù)（如存儲和數(shù)據(jù)庫）是 IaaS的一部分。Internet上其他類型的服務(wù)包括平臺即服務(wù)（Platform as a Service，PaaS）和軟件即服務(wù)（Software as a Service，SaaS）。PaaS提供了用戶可以訪問的完整或部分的應(yīng)用程序開發(fā)，SaaS則提供了完整的可直接使用的應(yīng)用程序，比如通過 Internet管理企業(yè)資源。

??三十九：HaaS

??以提供的Hadoop作為一種服務(wù)（HAAS）

??HaaS（Hardware-as-a-service）的意思是硬件即服務(wù)。HaaS概念的出現(xiàn)源于云計算，現(xiàn)在被稱作基礎(chǔ)架構(gòu)即服務(wù)（IaaS）或基礎(chǔ)架構(gòu)云，使用IaaS，各企業(yè)可通過Web將更多的基礎(chǔ)架構(gòu)容量作為服務(wù)提供?！巴ㄟ^Web”分配更多的存儲或處理容量當(dāng)然要比供應(yīng)商在基礎(chǔ)環(huán)境中引入和安裝新硬件要快得多。HaaS還具有另外一層含義是針對嵌入式設(shè)備而言的，目的在于建立通過互聯(lián)網(wǎng)（Web）進行嵌入式設(shè)備統(tǒng)一管理服務(wù)的模式。在這種情況下，HaaS類似于SaaS，對于嵌入式設(shè)備使用者來說，無需對所需嵌入式設(shè)備進行一次性購買，僅需按照設(shè)備使用量或其它標(biāo)準(zhǔn)支付設(shè)備的服務(wù)費及維護費即可。

??四十：決策樹

??決策樹(Decision Tree）是在已知各種情況發(fā)生概率的基礎(chǔ)上，通過構(gòu)成決策樹來求取凈現(xiàn)值的期望值大于等于零的概率，評價項目風(fēng)險，判斷其可行性的決策分析方法，是直觀運用概率分析的一種圖解法。由于這種決策分支畫成圖形很像一棵樹的枝干，故稱決策樹。在機器學(xué)習(xí)中，決策樹是一個預(yù)測模型，他代表的是對象屬性與對象值之間的一種映射關(guān)系。Entropy = 系統(tǒng)的凌亂程度，使用算法ID3, C4.5和C5.0生成樹算法使用熵。這一度量是基于信息學(xué)理論中熵的概念。

??四十一：EM算法

??最大期望算法（Expectation Maximization Algorithm，又譯期望最大化算法），是一種迭代算法，用于含有隱變量（hidden variable）的概率參數(shù)模型的最大似然估計或極大后驗概率估計。

??四十二：數(shù)據(jù)聚類

??數(shù)據(jù)聚類 (英語 : Cluster analysis) 是對于靜態(tài)數(shù)據(jù)分析的一門技術(shù)，在許多領(lǐng)域受到廣泛應(yīng)用，包括機器學(xué)習(xí)，數(shù)據(jù)挖掘，模式識別，圖像分析以及生物信息。聚類是把相似的對象通過靜態(tài)分類的方法分成不同的組別或者更多的子集（subset），這樣讓在同一個子集中的成員對象都有相似的一些屬性，常見的包括在坐標(biāo)系中更加短的空間距離等。

??四十三：概率模型

??給定一個用戶的查詢串，相對于該串存在一個包含所有相關(guān)文檔的集合。我們把這樣的集合看作是一個理想的結(jié)果文檔集，在給出理想結(jié)果集后，我們能很容易得到結(jié)果文檔。這樣我們可以把查詢處理看作是對理想結(jié)果文檔集屬性的處理。問題是我們并不能確切地知道這些屬性，我們所知道的是存在索引術(shù)語來表示這些屬性。由于在查詢期間這些屬性都是不可見的，這就需要在初始階段來估計這些屬性。這種初始階段的估計允許我們對首次檢索的文檔集合返回理想的結(jié)果集，并產(chǎn)生一個初步的概率描述。

??四十四：貝索斯定律

??英文：Bezos’ Law

??貝索斯定律是指在云的發(fā)展過程中，單位計算能力的價格大約每隔3年會降低50%。

??四十五：回歸分析

??回歸分析（regression analysis)是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。運用十分廣泛，回歸分析按照涉及的自變量的多少，可分為一元回歸分析和多元回歸分析；按照自變量和因變量之間的關(guān)系類型，可分為線性回歸分析和非線性回歸分析。如果在回歸分析中，只包括一個自變量和一個因變量，且二者的關(guān)系可用一條直線近似表示，這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量，且因變量和自變量之間是線性關(guān)系，則稱為多元線性回歸分析。

??四十六：推薦算法

??基于內(nèi)容的信息推薦方法的理論依據(jù)主要來自于信息檢索和信息過濾，所謂的基于內(nèi)容的推薦方法就是根據(jù)用戶過去的瀏覽記錄來向用戶推薦用戶沒有接觸過的推薦項。主要是從兩個方法來描述基于內(nèi)容的推薦方法：啟發(fā)式的方法和基于模型的方法。啟發(fā)式的方法就是用戶憑借經(jīng)驗來定義相關(guān)的計算公式，然后再根據(jù)公式的計算結(jié)果和實際的結(jié)果進行驗證，然后再不斷修改公式以達到最終目的。而對于模型的方法就是根據(jù)以往的數(shù)據(jù)作為數(shù)據(jù)集，然后根據(jù)這個數(shù)據(jù)集來學(xué)習(xí)出一個模型。

??四十七：八叉樹

??英文名：Octree

??八叉樹是一種用于描述三維空間的樹狀數(shù)據(jù)結(jié)構(gòu)。八叉樹的每個節(jié)點表示一個正方體的體積元素，每個節(jié)點有八個子節(jié)點，將八個子節(jié)點所表示的體積元素加在一起就等于父節(jié)點的體積。

??四十八：紅黑樹

??紅黑樹（Red Black Tree）是一種自平衡二叉查找樹，是在計算機科學(xué)中用到的一種數(shù)據(jù)結(jié)構(gòu)，典型的用途是實現(xiàn)關(guān)聯(lián)數(shù)組。

??它是在1972年由Rudolf Bayer發(fā)明的，當(dāng)時被稱為平衡二叉B樹（symmetric binary B-trees）。后來，在1978年被 Leo J. Guibas 和 Robert Sedgewick 修改為如今的“紅黑樹”。

??紅黑樹和AVL樹類似，都是在進行插入和刪除操作時通過特定操作保持二叉查找樹的平衡，從而獲得較高的查找性能。

??它雖然是復(fù)雜的，但它的最壞情況運行時間也是非常良好的，并且在實踐中是高效的：它可以在O(log n)時間內(nèi)做查找，插入和刪除，這里的n 是樹中元素的數(shù)目。

??四十九：哈希表

??散列表（Hash table，也叫哈希表），是根據(jù)關(guān)鍵碼值(Key value)而直接進行訪問的數(shù)據(jù)結(jié)構(gòu)。也就是說，它通過把關(guān)鍵碼值映射到表中一個位置來訪問記錄，以加快查找的速度。這個映射函數(shù)叫做散列函數(shù)，存放記錄的數(shù)組叫做散列表。

??給定表M，存在函數(shù)f(key)，對任意給定的關(guān)鍵字值key，代入函數(shù)后若能得到包含該關(guān)鍵字的記錄在表中的地址，則稱表M為哈希(Hash）表，函數(shù)f(key)為哈希(Hash) 函數(shù)。

??五十：隨機森林

??英文名：Random forest

??在機器學(xué)習(xí)中，隨機森林是一個包含多個決策樹的分類器，并且其輸出的類別是由個別樹輸出的類別的眾數(shù)而定。 Leo Breiman和Adele Cutler發(fā)展出推論出隨機森林的算法。而 “Random Forests” 是他們的商標(biāo)。這個術(shù)語是1995年由貝爾實驗室的Tin Kam Ho所提出的隨機決策森林（random decision forests）而來的。這個方法則是結(jié)合 Breimans 的 “Bootstrap aggregating” 想法和 Ho 的”random subspace method”” 以建造決策樹的集合。

以上就是海歷陽光翻譯公司就大數(shù)據(jù)翻譯英語常用詞匯總結(jié)之二的介紹,如果您有大數(shù)據(jù)翻譯的需求請聯(lián)系我們，海歷陽光翻譯將竭誠為您服務(wù)。

上一篇：銀行流水翻譯英文都有哪些注意事項？

下一篇：翻譯的幾點見解

翻譯語種LANAGESMORE++