數(shù)據(jù)分析的背景及現(xiàn)狀
呈指數(shù)增長(zhǎng)的數(shù)據(jù)量推動(dòng)云服務(wù)實(shí)現(xiàn)了高增長(zhǎng)和多樣性的發(fā)展。作為云服務(wù)提供商(CSP),會(huì)根據(jù)客戶(hù)對(duì)數(shù)據(jù)的需求來(lái)創(chuàng)建業(yè)務(wù),例如,提供存儲(chǔ)數(shù)據(jù)所需的基礎(chǔ)設(shè)施(基礎(chǔ)設(shè)施即服務(wù),簡(jiǎn)稱(chēng) IaaS),基于客戶(hù)數(shù)據(jù)的服務(wù)或軟件(軟件即服務(wù),簡(jiǎn)稱(chēng) SaaS),或者為客戶(hù)提供新的數(shù)據(jù)類(lèi)型和格式,例如高清視頻流媒體。數(shù)據(jù)量的增長(zhǎng)給各種規(guī)模的企業(yè)帶來(lái)挑戰(zhàn)的同時(shí)也帶來(lái)了新機(jī)遇。擁有相應(yīng)數(shù)據(jù)分析技術(shù)的企業(yè),可以從大數(shù)據(jù)中獲得更多關(guān)于客戶(hù)、市場(chǎng)、產(chǎn)品開(kāi)發(fā)、銷(xiāo)售趨勢(shì)和其他事件的信息。對(duì)于想要在競(jìng)爭(zhēng)中領(lǐng)跑的企業(yè),大數(shù)據(jù)分析是一種強(qiáng)大的工具,具有重要的變革意義。據(jù)報(bào)告稱(chēng),到 2017 年底,有 53% 的公司都使用了大數(shù)據(jù)分析,而在 2年之前,這一數(shù)字僅為 15%。對(duì)于云服務(wù)提供商,大數(shù)據(jù)分析蘊(yùn)藏著無(wú)限可能。一是可以借此機(jī)會(huì)洞察使用數(shù)據(jù)分析來(lái)生成關(guān)于客戶(hù)和企業(yè)的能力;二是可以通過(guò)數(shù)據(jù)分析服務(wù)為客戶(hù)提供差異化的商業(yè)洞察,借此建立新的收入渠道。
英特爾數(shù)據(jù)分析規(guī)劃的五大階段
隨著企業(yè)利用數(shù)據(jù)分析解決方案從概念驗(yàn)證(PoC)階段邁入部署階段,2017 年的全球大數(shù)據(jù)分析市場(chǎng)相比上一年增長(zhǎng)了 24.5%。此外,分析機(jī)構(gòu) Gartner 在2017 年對(duì) 2,500 名 CIO 實(shí)施調(diào)查后發(fā)現(xiàn),所有類(lèi)型的企業(yè)都把“商業(yè)智能和數(shù)據(jù)分析”的支出列為首要的投資事項(xiàng)。所有這些調(diào)查都顯示,對(duì)于云服務(wù)提供商,現(xiàn)在正是他們利用數(shù)據(jù)分析向前發(fā)展的大好時(shí)機(jī):市場(chǎng)正在增長(zhǎng),而客戶(hù)和 CIO 們都已經(jīng)做好了投資準(zhǔn)備。英特爾的數(shù)據(jù)分析規(guī)劃指南描繪了從描述性分析到認(rèn)知性分析的 5 個(gè)階段(參見(jiàn)圖 1)。研究顯示,大部分企業(yè)都處于前兩個(gè)階段之間:描述性分析和診斷性分析。從圖表中可以清晰看出,許多企業(yè)距離達(dá)到成熟的數(shù)據(jù)分析還有一段相當(dāng)長(zhǎng)的距離。
圖 1:數(shù)據(jù)分析成熟度的各個(gè)階段實(shí)施數(shù)據(jù)分析不可或缺的因素 許多企業(yè)已經(jīng)具備了實(shí)施數(shù)據(jù)分析所需的數(shù)據(jù)、技術(shù)和流程,為企業(yè)利用分析所能提供的優(yōu)勢(shì)打下了良好的基礎(chǔ)。促使企業(yè)進(jìn)一步向高級(jí)分析邁進(jìn),需要的因素有:1.對(duì)所擁有的數(shù)據(jù)有深入的了解,知道如何利用數(shù)據(jù)2.了解數(shù)據(jù)分析能夠帶來(lái)的業(yè)務(wù)價(jià)值3.負(fù)責(zé)開(kāi)發(fā)數(shù)據(jù)分析項(xiàng)目的內(nèi)部人才,例如,數(shù)據(jù)科學(xué)家或其他專(zhuān)家4.支持更高級(jí)數(shù)據(jù)分析項(xiàng)目所需的數(shù)據(jù)中心基礎(chǔ)設(shè)施,例如軟件定義基礎(chǔ)設(shè)施或足夠的處理能力5.不了解哪些工具能夠?yàn)橐蕾?lài)數(shù)據(jù)的員工提供支持,以便他們根據(jù)數(shù)據(jù)洞察來(lái)做出業(yè)務(wù)決策并履行工作職責(zé)
數(shù)據(jù)分析變革趨勢(shì)
據(jù)分析師預(yù)測(cè),全球分析市場(chǎng)將持續(xù)增長(zhǎng),到 2026 年,市場(chǎng)規(guī)模將達(dá)到 922 億美元。隨著市場(chǎng)發(fā)展,云服務(wù)提供商將獲得更多機(jī)會(huì),通過(guò)為客戶(hù)提供分析服務(wù)來(lái)實(shí)現(xiàn)收入增長(zhǎng)。在這個(gè)快速發(fā)展的市場(chǎng)中,云服務(wù)提供商需要了解的重要趨勢(shì)包括:1.Hadoop* 曾為大數(shù)據(jù)分析的事實(shí)標(biāo)準(zhǔn),現(xiàn)已發(fā)展成熟,且仍被廣泛使用。但是,對(duì)于希望利用新的分析部署來(lái)顛覆市場(chǎng)的創(chuàng)新型企業(yè),Hadoop 開(kāi)始被視為陳舊技術(shù)。2.更快速、更有針對(duì)性的數(shù)據(jù)處理技術(shù)正被廣泛采用。例如:適用于一般數(shù)據(jù)處理的 Apache Spark*、適用于分布式高性能數(shù)據(jù)流傳輸應(yīng)用的 Apache Flink*,以及適用于數(shù)據(jù)批處理和流傳輸數(shù)據(jù)處理的 Apache Beam*。3.打包式分析應(yīng)用和解決方案的數(shù)量不斷增加,也越來(lái)越受到用戶(hù)歡迎。企業(yè)逐漸趨向于采用開(kāi)源和非專(zhuān)用分析解決方案,這些解決方案允許企業(yè)根據(jù)自身的需求,混合采用最匹配的分析工具。4.人工智能(AI)是許多分析提供商想要實(shí)現(xiàn)的最終目標(biāo),利用先進(jìn)的自學(xué)分析算法來(lái)為企業(yè)提供完全自動(dòng)化的洞察。開(kāi)始著手發(fā)展數(shù)據(jù)分析能力之前,云服務(wù)提供商要做的第一步是理解數(shù)據(jù)分析所具備的變革能力,不只是對(duì)于自身企業(yè),還有為客戶(hù)企業(yè)帶來(lái)的影響。
云服務(wù)提供商的機(jī)遇
云服務(wù)提供商是推動(dòng)數(shù)據(jù)分析發(fā)展的一支重要力量。借助云服務(wù)提供商的數(shù)據(jù)中心,企業(yè)通常能夠更好地整理、瀏覽和查詢(xún)數(shù)據(jù)。數(shù)據(jù)分析能夠給云服務(wù)提供商帶來(lái)的一些特定機(jī)遇,幫助他們實(shí)現(xiàn)差異化服務(wù)。1. 憑借出色的客戶(hù)洞察,實(shí)現(xiàn)收入增長(zhǎng)對(duì)于云服務(wù)提供商,最直接的機(jī)遇源自為他們自己提供數(shù)據(jù)分析項(xiàng)目。通過(guò)了解數(shù)據(jù)分析能夠給云服務(wù)業(yè)務(wù)帶來(lái)哪些可能性,您就能夠設(shè)立與如何使用數(shù)據(jù)有關(guān)的目標(biāo),以及未來(lái)您可能希望提供哪些基于分析的服務(wù)。2. 提供客戶(hù)所需的數(shù)據(jù)分析專(zhuān)業(yè)知識(shí)對(duì)于許多企業(yè)而言,最大的挑戰(zhàn)在于不知從何處開(kāi)始數(shù)據(jù)分析。無(wú)論客戶(hù)希望實(shí)現(xiàn)什么結(jié)果,他們的數(shù)據(jù)驅(qū)動(dòng)能力很大程度上都依賴(lài)于他們當(dāng)前數(shù)據(jù)的全面性和可用性。要評(píng)估客戶(hù)在多大程度上準(zhǔn)備好開(kāi)始采用更高級(jí)的分析,您可以詢(xún)問(wèn)諸如以下這些問(wèn)題:企業(yè)是否具備數(shù)據(jù)清單,或者其他了解已有數(shù)據(jù)內(nèi)容和位置的方式?他們是否明確了解數(shù)據(jù)之間存在的空白,以及可能填補(bǔ)這些空白的方式?員工是否能夠簡(jiǎn)便地訪問(wèn)所需的信息?各業(yè)務(wù)部門(mén)需要等待多久才能獲得所需的數(shù)據(jù)?他們是否能夠即時(shí)獲得報(bào)告,還是必須等待幾天或幾周?客戶(hù)對(duì)于這些問(wèn)題的回答有助于您引導(dǎo)他們踏上數(shù)據(jù)分析之旅,并與他們合作,帶領(lǐng)他們向成熟的數(shù)據(jù)分析邁進(jìn)(參見(jiàn)圖 1)。3. 幫助客戶(hù)整理和分類(lèi)數(shù)據(jù)在您的客戶(hù)中,有些可能并不完全了解他們擁有的數(shù)據(jù),也不知道何處存在空白,以及該如何使用數(shù)據(jù)。許多公司仍然將數(shù)據(jù)保存在由應(yīng)用、業(yè)務(wù)部門(mén)、項(xiàng)目或生成位置所定義的孤島內(nèi)??赡艽嬖谶@樣一種基本需求:需要將您的客戶(hù)所擁有的不同類(lèi)型的數(shù)據(jù)集合到一起,并且按照能夠查詢(xún)和從中獲取價(jià)值的方式進(jìn)行整理。4. 支持客戶(hù)的數(shù)據(jù)分析概念驗(yàn)證對(duì)于想要形成自己的分析能力的企業(yè)而言,最重要的步驟之一就是創(chuàng)建概念驗(yàn)證(PoC)??蛻?hù)能夠借助這種方法,證明數(shù)據(jù)分析可以為企業(yè)帶來(lái)的實(shí)際好處。此外,概念驗(yàn)證還有助他們檢驗(yàn)對(duì)數(shù)據(jù)的理解程度,了解將來(lái)數(shù)據(jù)分析項(xiàng)目全面鋪開(kāi)后可能遇到的獨(dú)特挑戰(zhàn)。對(duì)于身為云服務(wù)提供商的您而言,通過(guò)客戶(hù)的概念驗(yàn)證,可以證實(shí)您的分析服務(wù)能夠?qū)崿F(xiàn)預(yù)期的結(jié)果,從而有助于您成為客戶(hù)信賴(lài)的數(shù)據(jù)處理合作伙伴。5. 提供預(yù)打包的數(shù)據(jù)分析應(yīng)用根據(jù)您的客戶(hù)所在的行業(yè)領(lǐng)域,可能存在幾種具備廣泛吸引力的常見(jiàn)分析應(yīng)用案例,例如:銷(xiāo)售與營(yíng)銷(xiāo)對(duì)于銷(xiāo)售團(tuán)隊(duì),如果能實(shí)時(shí)訪問(wèn)與客戶(hù)有關(guān)的可信洞察,將帶來(lái)重大變革。在數(shù)據(jù)分析服務(wù)中采用最常見(jiàn)的數(shù)據(jù)格式,并將這些數(shù)據(jù)結(jié)合起來(lái)得出新的洞察,這可以讓您的客戶(hù)與目標(biāo)受眾進(jìn)行更加有效的對(duì)話,將更多機(jī)會(huì)轉(zhuǎn)化成銷(xiāo)售,提升客戶(hù)的忠誠(chéng)度。采用這種方法的一個(gè)例子就是 Salesforce 的 Einstein Analytics* 解決方案,它允許Salesforce 的客戶(hù)在預(yù)先構(gòu)建的應(yīng)用和儀表板內(nèi)探索從任何來(lái)源獲得的各種數(shù)據(jù)。它讓用戶(hù)獲得關(guān)于目標(biāo)對(duì)象和客戶(hù)的新洞察,從而幫助提高營(yíng)銷(xiāo)、銷(xiāo)售和客戶(hù)對(duì)話的效率。物聯(lián)網(wǎng)(IoT)傳感器如今在各行業(yè)中非常常見(jiàn),從制造到醫(yī)療,從運(yùn)輸?shù)搅闶郏寄芤?jiàn)到傳感器的身影。這些傳感器收集的數(shù)據(jù)如果能夠正確查詢(xún),則可以提供大量潛在信息。專(zhuān)用于從特定類(lèi)型的傳感器數(shù)據(jù)獲得洞察的應(yīng)用,可能比較容易被一些已經(jīng)開(kāi)始利用物聯(lián)網(wǎng)的客戶(hù)所接受。例如,在阿姆斯特丹等智慧城市,經(jīng)常利用強(qiáng)有力的分析技術(shù),對(duì)傳感器數(shù)據(jù)進(jìn)行分析,以此緩解交通擁堵及與之相關(guān)的污染。這還只是數(shù)據(jù)分析提升居民生活品質(zhì)的其中一種方式而已(參見(jiàn)圖 2)。
圖 2. 高級(jí)分析中的機(jī)遇 – 傳感器和物聯(lián)網(wǎng) 特定于行業(yè)的應(yīng)用各個(gè)企業(yè)或組織都會(huì)關(guān)注不同的分析應(yīng)用案例,具體由它們所在的行業(yè)領(lǐng)域決定。例如,在零售行業(yè),亞馬遜正通過(guò)將多個(gè)傳感器和基于機(jī)器學(xué)習(xí)算法的實(shí)時(shí)分析結(jié)合在一起,借此創(chuàng)建無(wú)人商店。無(wú)論您的客戶(hù)是處于醫(yī)療、制造、政府,還是完全處于其他領(lǐng)域,您的專(zhuān)業(yè)洞察都有助于提供滿(mǎn)足他們需求的分析服務(wù)。
基于云的數(shù)據(jù)分析面臨的挑戰(zhàn)
為客戶(hù)設(shè)計(jì)基于云的分析服務(wù)時(shí),需謹(jǐn)記他們目前在采用方面所面臨的障礙,這非常重要。應(yīng)當(dāng)思考他們無(wú)法進(jìn)一步向高級(jí)分析邁進(jìn)的原因,這有助于您準(zhǔn)確找出適合他們的解決方案和服務(wù)。1.時(shí)間和成本數(shù)據(jù)分析項(xiàng)目涉及大量管理和治理工作,因而對(duì)小型企業(yè)來(lái)說(shuō)是一個(gè)嚴(yán)峻的挑戰(zhàn)。構(gòu)建流暢、預(yù)打包的工作流程來(lái)幫助您的客戶(hù)處理好大數(shù)據(jù)分析的治理與管理,是確保數(shù)據(jù)分析服務(wù)具備吸引力的一個(gè)有效策略。2.復(fù)雜性對(duì)于大多數(shù)用戶(hù)而言,大數(shù)據(jù)分析項(xiàng)目的環(huán)境和用戶(hù)界面仍然太過(guò)復(fù)雜。公司可能會(huì)加大對(duì)分析環(huán)境的投資,以獲得簡(jiǎn)單的工具和功能,讓廣大員工都能夠順暢使用它們。云服務(wù)提供商若能關(guān)注數(shù)據(jù)分析環(huán)境的可用性,將更有希望提高利潤(rùn)。3.咨詢(xún)鑒于數(shù)據(jù)分析項(xiàng)目所需的專(zhuān)業(yè)知識(shí),很少有企業(yè)能夠在不介入外部咨詢(xún)的情況下提供數(shù)據(jù)分析項(xiàng)目。這可能非常令人懊惱,對(duì)小型企業(yè)來(lái)說(shuō)尤其如此,但云服務(wù)提供商可以從兩個(gè)方面入手,幫助企業(yè)消除這方面的需求。通過(guò)結(jié)合易于使用的定制分析應(yīng)用(面向常見(jiàn)的應(yīng)用案例),提供自己的專(zhuān)業(yè)咨詢(xún)服務(wù),云服務(wù)提供商就可以幫助客戶(hù)實(shí)現(xiàn)其數(shù)據(jù)分析目標(biāo),讓他們無(wú)需購(gòu)買(mǎi)成本高昂的專(zhuān)業(yè)服務(wù)。
數(shù)據(jù)驅(qū)動(dòng)型企業(yè)的技術(shù)基礎(chǔ)
擁有合適的技術(shù)是推動(dòng)企業(yè)向數(shù)據(jù)驅(qū)動(dòng)型企業(yè)轉(zhuǎn)型的基礎(chǔ),也是客戶(hù)從中獲取數(shù)據(jù)驅(qū)動(dòng)型服務(wù)和解決方案的來(lái)源。1. 性能對(duì)于大多數(shù)云服務(wù)提供商而言,主要挑戰(zhàn)不在于獲得數(shù)據(jù)和基礎(chǔ)設(shè)施,而是如何以足夠快的速度從數(shù)據(jù)中獲取洞察,從而為客戶(hù)提供價(jià)值,快速獲取投資回報(bào)。對(duì)于致力于提供分析服務(wù)的云服務(wù)提供商而言,關(guān)鍵詞就是“獲取洞察的時(shí)間”。在企業(yè)領(lǐng)導(dǎo)者和數(shù)據(jù)科學(xué)家?guī)ьI(lǐng)企業(yè)在數(shù)據(jù)分析之旅中向前邁進(jìn)時(shí),這已成為衡量成敗與否的關(guān)鍵指標(biāo)。1.1 處理器性能為了提供符合客戶(hù)期望的數(shù)據(jù)分析工作負(fù)載,您需要確保新服務(wù)基于最新的處理器技術(shù)。英特爾® 至強(qiáng)® 可擴(kuò)展處理器基于上一代英特爾® 至強(qiáng)® 處理器出色的性能、效率和價(jià)值而構(gòu)建,能夠提供以下優(yōu)勢(shì):更高的性能,將 4 年的 TCO 降低高達(dá) 65%更多內(nèi)核、更高內(nèi)存帶寬和 I/O 性能提升,在 SAP HANA* 上每小時(shí)執(zhí)行的查詢(xún)量提高 1.5 倍更快的大數(shù)據(jù)查詢(xún),例如采用 IBM DB2 時(shí),將批量分析的平均速度加快 1.4 倍每秒運(yùn)算次數(shù)提升高達(dá) 4.6 倍,支持多達(dá) 5 倍的客戶(hù)端數(shù)量(采用 Cassandra* NoSQL 數(shù)據(jù)庫(kù))1.2 存儲(chǔ)和內(nèi)存性能通過(guò)將英特爾® 至強(qiáng)® 可擴(kuò)展處理器與英特爾® 傲騰™ 技術(shù)和英特爾® 固態(tài)盤(pán)(英特爾® SSD)結(jié)合在一起,云服務(wù)提供商能夠從數(shù)據(jù)分析平臺(tái)的性能改善中獲益。對(duì)于 SAS Business Analytics*,結(jié)合使用兩種技術(shù)生成的洞察,要比僅僅一年前使用英特爾最出色的平臺(tái)快 2 倍(參見(jiàn)圖3)。
圖3. 數(shù)據(jù)分析平臺(tái)的性能 內(nèi)存和存儲(chǔ)技術(shù)的進(jìn)步對(duì)于能否實(shí)現(xiàn)更高水平的數(shù)據(jù)分析性能至關(guān)重要,英特爾正利用新一代的持久內(nèi)存,基于英特爾和 Micron 聯(lián)合開(kāi)發(fā)的 3D XPoint ™ 媒體,來(lái)助力推動(dòng)實(shí)現(xiàn)這些改進(jìn) 。借助這一技術(shù),數(shù)據(jù)中心的操作員可將更多數(shù)據(jù)放置在更靠近處理器的非易失性媒介上,借此克服一直以來(lái)阻礙實(shí)現(xiàn)更高應(yīng)用容量和性能的障礙。這種經(jīng)濟(jì)的持久內(nèi)存可能會(huì)徹底改變 SAP HANA* 和其他內(nèi)存數(shù)據(jù)庫(kù)等應(yīng)用案例,使用戶(hù)能夠更快速地生成更好的洞察。此外,這些技術(shù)支持更快的數(shù)據(jù)獲取,可以縮短訓(xùn)練和運(yùn)行模型所需的時(shí)間。1.3 網(wǎng)絡(luò)性能出于預(yù)測(cè)性分析目的,我們會(huì)將數(shù)據(jù)湖或倉(cāng)庫(kù)中的數(shù)據(jù)移至計(jì)算基礎(chǔ)設(shè)施,如果此過(guò)程出現(xiàn)延遲,則會(huì)增加實(shí)時(shí)操作的成本。為了幫助云服務(wù)提供商避免遭遇這類(lèi)延遲,英特爾提供了市面上速度最快的高帶寬網(wǎng)絡(luò),從而跨不同網(wǎng)絡(luò)通道加速預(yù)測(cè)性分析工作負(fù)載。1.4 軟件框架和庫(kù)為數(shù)據(jù)分析應(yīng)用案例選擇正確的框架和庫(kù),對(duì)于數(shù)據(jù)分析服務(wù)能否實(shí)現(xiàn)高性?xún)r(jià)比至關(guān)重要。根據(jù)應(yīng)用案例,您的基礎(chǔ)設(shè)施需要為分布式處理框架組合提供支持,例如Apache Spark* 軟件、非關(guān)系型分析數(shù)據(jù)庫(kù)和分析應(yīng)用。
對(duì)于更高級(jí)的分析應(yīng)用案例,例如指導(dǎo)性分析,深度學(xué)習(xí)能夠以越來(lái)越快的速度自動(dòng)對(duì)大數(shù)據(jù)重復(fù)應(yīng)用復(fù)雜的數(shù)學(xué)計(jì)算,借此生成洞察。但是,許多框架和庫(kù)的設(shè)計(jì)并不支持大數(shù)據(jù)堆棧,因此往往難以高效地管理大型數(shù)據(jù)集。為了幫助企業(yè)彌補(bǔ)這一空白,英特爾開(kāi)發(fā)出了 BigDL。這是一種基于 Spark* 平臺(tái)在本機(jī)構(gòu)建的開(kāi)源、分布式深度學(xué)習(xí)庫(kù)(參見(jiàn)圖 4)。BigDL 能夠橫向擴(kuò)展至數(shù)千臺(tái)服務(wù)器,采用英特爾® 數(shù)學(xué)核心函數(shù)庫(kù)(英特爾® MKL)和并行計(jì)算技術(shù),在基于英特爾® 至強(qiáng)® 處理器的服務(wù)器上實(shí)現(xiàn)高性能。英特爾® MKL 能夠以最小的工作量,為未來(lái)的英特爾® 處理器系列優(yōu)化代碼。它可以兼容您選擇的編譯器、語(yǔ)言、操作系統(tǒng)、鏈接以及線程模型。
圖 4:BigDL 為 Spark*(使用 CPU)上的深度學(xué)習(xí)提供原生支持 如果云服務(wù)提供商現(xiàn)有的大數(shù)據(jù)工作負(fù)載使用 Spark/Hadoop 集群,則可以輕松集成 BigDL,讓客戶(hù)將深度學(xué)習(xí)集成到現(xiàn)有工作負(fù)載中。它支持您使用現(xiàn)有的基礎(chǔ)設(shè)施來(lái)引入大數(shù)據(jù)即服務(wù)和人工智能即服務(wù)功能,從而利用差異化的服務(wù)進(jìn)一步推動(dòng)業(yè)務(wù)發(fā)展,同時(shí)縮短深度學(xué)習(xí)增強(qiáng)服務(wù)和解決方案上市的時(shí)間。
比起開(kāi)箱即用的開(kāi)放式深度學(xué)習(xí)框架,BigDL 的實(shí)現(xiàn)速度更快,這是因?yàn)樗梢栽诖鎯?chǔ)數(shù)據(jù)的同一集群上分析大數(shù)據(jù),從而降低系統(tǒng)的復(fù)雜程度,縮短端到端學(xué)習(xí)的延遲。采用 BigDL 之后,您可以將來(lái)自其他深度學(xué)習(xí)框架的預(yù)先訓(xùn)練模型加載到 Spark 中,例如 Tensorflow*、Keras*、Caffe* 和 Torch*。之后,可對(duì)它們實(shí)施微調(diào)、推理,并用于學(xué)習(xí)。2. 可擴(kuò)展性數(shù)據(jù)分析服務(wù)所依托的技術(shù)需要適應(yīng)不斷變化的業(yè)務(wù)需求。例如,如果隨時(shí)間過(guò)去,數(shù)據(jù)需要改變,或者需要針對(duì)特定項(xiàng)目實(shí)施改變,您的基礎(chǔ)設(shè)施必須適應(yīng)這種改變,以讓客戶(hù)保持滿(mǎn)意。全新英特爾® 至強(qiáng)® 可擴(kuò)展處理器旨在加快數(shù)據(jù)分析工作負(fù)載的速度,完善機(jī)器學(xué)習(xí)和人工智能等技術(shù),讓它們成為數(shù)據(jù)分析服務(wù)的理想基礎(chǔ)。3. 兼容性阻礙最終用戶(hù)采用數(shù)據(jù)分析的主要障礙之一是復(fù)雜性。造成這種復(fù)雜性的部分原因在于數(shù)據(jù)分析生態(tài)系統(tǒng)的廣度。企業(yè)可以選擇不同的供應(yīng)商、技術(shù)堆棧和項(xiàng)目,用于部署數(shù)據(jù)分析——由于這些解決方案之間不具備互操作性,因此會(huì)進(jìn)一步加劇復(fù)雜性。隨著數(shù)據(jù)分析市場(chǎng)的發(fā)展,企業(yè)各自束縛于特定的供應(yīng)商解決方案,常常想要采取模塊化方法來(lái)組合數(shù)據(jù)分析系統(tǒng)。為此,云服務(wù)提供商需要確保數(shù)據(jù)分析服務(wù)、平臺(tái)和應(yīng)用都能與任何其他項(xiàng)目或客戶(hù)可能想要使用的附件兼容,這一點(diǎn)非常重要。
一些相關(guān)的技術(shù)已經(jīng)涌現(xiàn),可幫助云服務(wù)提供商及客戶(hù)解決兼容性問(wèn)題。例如,Alluxio 是一種開(kāi)源解決方案,它允許任何應(yīng)用與來(lái)自任何存儲(chǔ)系統(tǒng)(存儲(chǔ)器速度)的數(shù)據(jù)交互,將計(jì)算和存儲(chǔ)分離開(kāi)來(lái),且不會(huì)導(dǎo)致性能下降。對(duì)于提供多種分析功能的云服務(wù)提供商而言,這可以統(tǒng)一不同系統(tǒng)的數(shù)據(jù)訪問(wèn),橋接計(jì)算框架和底層存儲(chǔ)。
拓展數(shù)據(jù)分析業(yè)務(wù)的后續(xù)行動(dòng)
高級(jí)分析和公有云彼此相連,難以分割,而云服務(wù)提供商在交付變革性洞察方面發(fā)揮著基礎(chǔ)性作用。當(dāng)前存在大量機(jī)會(huì),可供云服務(wù)提供商構(gòu)建新的基于分析的差異化服務(wù),但這需要高性能、高效且可擴(kuò)展的基礎(chǔ)設(shè)施作為保障。如果云服務(wù)提供商有意通過(guò)數(shù)據(jù)分析拓展業(yè)務(wù),可采取以下后續(xù)行動(dòng):研究了解客戶(hù)想要通過(guò)數(shù)據(jù)分析實(shí)現(xiàn)哪些結(jié)果,并從競(jìng)爭(zhēng)對(duì)手使用數(shù)據(jù)分析技術(shù)的做法中獲得啟發(fā)。組建自己的團(tuán)隊(duì)客戶(hù)會(huì)依賴(lài)于您的數(shù)據(jù)分析專(zhuān)業(yè)知識(shí),所以務(wù)必確保擁有自己的數(shù)據(jù)科學(xué)家,以及了解數(shù)據(jù)分析環(huán)境的產(chǎn)品開(kāi)發(fā)團(tuán)隊(duì)。評(píng)估現(xiàn)有 IT 系統(tǒng)使用上面的“技術(shù)考量因素”部分作為確定基礎(chǔ)設(shè)施和流程適用性的起點(diǎn),發(fā)現(xiàn)可以升級(jí)或改進(jìn)的環(huán)節(jié)。
文章摘自英特爾精英匯
想購(gòu)買(mǎi)及了解更多英特爾產(chǎn)品詳情,歡迎咨詢(xún)以下聯(lián)系方式!
寶通集團(tuán)聯(lián)系方式
咨詢(xún)熱線:0755-88603572
寶通官網(wǎng):www.bjshst.cn
客戶(hù)垂詢(xún)郵箱:cuifang.mo@ex-channel.com
客戶(hù)垂詢(xún)QQ:1627678462
地址:深圳市福田區(qū)深南大道1006號(hào)國(guó)際創(chuàng)新中心C座11樓
郵編:518026