資源簡介 第五章數據處理和可視化表達選擇題關于大數據的特征說法中不正確的是( )數據體量巨大。從TB級別躍升到PB級別。數據類型繁多價值密度低大數據時代研究的數據如此之多,追求的不是精確性,而是模糊性。在目前計算機中,硬盤容量大多是( )B級。TPBD在信息系統(tǒng)中,系統(tǒng)日志包括操作系統(tǒng)日志、( )和安全日志。應用程序日志信息日志算法日志以上都是URL指的是( )應用程序接口網絡爬蟲統(tǒng)一資源定位符以上都不正確( )已經成為存儲發(fā)展的一種趨勢,其技術也日益成熟。U盤云存儲數據庫以上全不正確數據特征探索的主要任務是對數據進行預處理,發(fā)現和處理( ),繪制直方圖,觀察分析數據的分布特征。缺失值、異常數據數據之間的關聯性數據的規(guī)律以上全不正確K-平均算法是一種經典的( )算法。關聯分析數據分類聚類分析數據可視化數據分類是數據分析處理中最基本的方法。數據分類通常的做法是,基于樣本數據先訓練構建分類函數或者分類模型(也稱分類器),該分類器具有將待分類數據項映射到某一特點類別的功能。下面的示意圖①②③應該是( )輸入 訓練 預測輸入 預測 訓練預測 輸入 訓練訓練 輸入 預測數據可視化表達可以更加直觀形象地呈現數據,下列關于數據可視化表達不合理的是( )利用拆線圖呈現微博熱議變化趨勢利用餅圖反映農副產品價格與節(jié)假日關系利用柱形圖展示娛樂節(jié)目參賽選手得票情況利用雷達圖對比兩個用戶在購買頻率、購買商品種類等5個維度上的差異10.兩個籃球運動員的場均得分可能有較大差別,但他們的場均籃板、推斷和蓋帽數據卻可能非常接近。要探尋兩個球員賽季各項數據的差異和聯系,可選用( )。A.拆線圖B.餅圖C.散點圖D.雷達圖判斷題利用電子表格軟件處理數據時,一般用餅圖表示事物隨時間變化的趨勢。( )數據可視化表達工具Seaborn是獨立于Matplotlib的。( )Bokeh也是一個很好的可視化庫,可實現交互式可視化。它的重點在其交互性,且是通過瀏覽器以數據驅動文檔的風格呈現。( )數據分析就是在一大批雜亂無章的數據中,運用數字化工具和計算方法,探索數據內在的結構的規(guī)律,探究數據本身的價值,為后面的決策提供依據。( )數據可視化可以讓人們快速抓住要點信息,讓關鍵的數據點從人們的眼睛快速通往心靈。( )三、簡答題請寫出生成詞云圖至少所需要的3種第三方庫并說明這3種庫各自的作用。第五章數據處理和可視化表達選擇題關于大數據的特征說法中不正確的是( C )數據體量巨大。從TB級別躍升到PB級別。數據類型繁多價值密度低大數據時代研究的數據如此之多,追求的不是精確性,而是模糊性。在目前計算機中,硬盤容量大多是( A )B級。TPBD在信息系統(tǒng)中,系統(tǒng)日志包括操作系統(tǒng)日志、( A )和安全日志。應用程序日志信息日志算法日志以上都是URL指的是( C)應用程序接口網絡爬蟲統(tǒng)一資源定位符以上都不正確( B)已經成為存儲發(fā)展的一種趨勢,其技術也日益成熟。U盤云存儲數據庫以上全不正確數據特征探索的主要任務是對數據進行預處理,發(fā)現和處理( A ),繪制直方圖,觀察分析數據的分布特征。缺失值、異常數據數據之間的關聯性數據的規(guī)律以上全不正確K-平均算法是一種經典的( C)算法。關聯分析數據分類聚類分析數據可視化數據分類是數據分析處理中最基本的方法。數據分類通常的做法是,基于樣本數據先訓練構建分類函數或者分類模型(也稱分類器),該分類器具有將待分類數據項映射到某一特點類別的功能。下面的示意圖①②③應該是( A)輸入 訓練 預測輸入 預測 訓練預測 輸入 訓練訓練 輸入 預測數據可視化表達可以更加直觀形象地呈現數據,下列關于數據可視化表達不合理的是( B )利用拆線圖呈現微博熱議變化趨勢利用餅圖反映農副產品價格與節(jié)假日關系利用柱形圖展示娛樂節(jié)目參賽選手得票情況利用雷達圖對比兩個用戶在購買頻率、購買商品種類等5個維度上的差異10.兩個籃球運動員的場均得分可能有較大差別,但他們的場均籃板、推斷和蓋帽數據卻可能非常接近。要探尋兩個球員賽季各項數據的差異和聯系,可選用( D)。A.拆線圖B.餅圖C.散點圖D.雷達圖判斷題利用電子表格軟件處理數據時,一般用餅圖表示事物隨時間變化的趨勢。(F)數據可視化表達工具Seaborn是獨立于Matplotlib的。( F)Bokeh也是一個很好的可視化庫,可實現交互式可視化。它的重點在其交互性,且是通過瀏覽器以數據驅動文檔的風格呈現。(T)數據分析就是在一大批雜亂無章的數據中,運用數字化工具和計算方法,探索數據內在的結構的規(guī)律,探究數據本身的價值,為后面的決策提供依據。(T)數據可視化可以讓人們快速抓住要點信息,讓關鍵的數據點從人們的眼睛快速通往心靈。(T)三、簡答題請寫出生成詞云圖至少所需要的3種第三方庫并說明這3種庫各自的作用。解:至少需要的3個庫:jieba、Wordcloud、matplotlib。Jieba:因為要把一份待分析的文本數據的句子和段落劃分成詞,需用jieba庫。Wordcloud:分詞之后,就需要根據分詞結果生成詞云,這個過程需要用到Wordcloud庫Matplotlib:需要用matplotlib庫中的pyplot來繪圖 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫