資源簡介 第二節(jié)大數(shù)據(jù)處理一、選擇題(共16題)1.大數(shù)據(jù)的特征可以用被總結(jié)為4V特征,以下哪個不屬于大數(shù)據(jù)的4V特征( )A.種類多(Variety) B.體量大(Volume)C.風(fēng)險大(Venture) D.速度快(Velocity)2.下列關(guān)于大數(shù)據(jù)(Big data)特點(diǎn)的敘述,錯誤的是A.?dāng)?shù)據(jù)體量巨大B.?dāng)?shù)據(jù)類型繁多C.商業(yè)價值高D.處理速度慢3.在教科書中利用Python探究電流和電壓、電阻的關(guān)系實(shí)驗(yàn)里,除了可以通過書中的Jupyter Notebook外,處理數(shù)據(jù)還可以通過下列( )工具實(shí)現(xiàn)。A.Python IDLE B.Xmind C.網(wǎng)絡(luò)畫板 D.幾何畫板4.對于大數(shù)據(jù)特征的描述,不正確的是( )。A.海量的數(shù)據(jù)規(guī)模(巨量性) B.快速的數(shù)據(jù)流轉(zhuǎn)(迅變性)C.單一的數(shù)據(jù)類型(單一性) D.高質(zhì)量的數(shù)據(jù)要求(真實(shí)性)5.隨著時代的發(fā)展,各行各業(yè)需要處理的的數(shù)據(jù)量快速增長,人工處理大量數(shù)據(jù)的效率與用計(jì)算機(jī)處理大量數(shù)據(jù)相比較,人工處理效率正變得( )。A.更高 B.更低 C.一樣 D.無法比較6.居民身份證號碼可以反映出常住戶口所在地的行政區(qū)劃、出生日期和性別等信息,這主要體現(xiàn)了數(shù)據(jù)是( )。A.計(jì)算工具識別、存儲和加工的對象 B.信息的載體 C.可處理的 D.可加工的7.大數(shù)據(jù)時代已經(jīng)在悄悄地改變我們的日常生活,也使人們?nèi)粘I罡鼮楸憬荩缫苿又Ц丁⒕W(wǎng)絡(luò)約車出行、網(wǎng)絡(luò)購物、網(wǎng)絡(luò)預(yù)約掛號等。以下不屬于大數(shù)據(jù)分析的是( )A.特征探索 B.關(guān)聯(lián)分析 C.聚類與分類 D.建模分析8.下列關(guān)于大數(shù)據(jù)處理的說法,錯誤的是 ( )A.處理大數(shù)據(jù)一般采用分治思想 B.?dāng)?shù)據(jù)采集只能收集結(jié)構(gòu)化數(shù)據(jù)C.圖計(jì)算主要針對圖數(shù)據(jù) D.并行處理能節(jié)省復(fù)雜問題的處理時間9.以下關(guān)于數(shù)據(jù)的說法,正確的是( )A.?dāng)?shù)據(jù)處理的速度主要取決于計(jì)算機(jī)硬件設(shè)備,軟件影響不大B.大數(shù)據(jù)中,每個數(shù)據(jù)的價值都非常大,不能隨意處理C.在計(jì)算機(jī)中,所有的數(shù)據(jù)都是結(jié)構(gòu)化的D.?dāng)?shù)據(jù)安全不僅是保障數(shù)據(jù)不損壞,也要考慮數(shù)據(jù)被入侵偷竊的情況10.大數(shù)據(jù)不是要教機(jī)器像人一樣思考。相反,它是( )A.把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性。B.被視為人工智能的一部分。C.被視為一種機(jī)器學(xué)習(xí)。D.預(yù)測與懲罰。11.下列對大數(shù)據(jù)的理解錯誤的是( )。A.從互聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù)的角度來看,大數(shù)據(jù)具有“4V”特征,分別是大量(Volume),多樣(Variety),低價值密度(Value),高速(Velocity)。B.從互聯(lián)網(wǎng)思維的角度來看,大數(shù)據(jù)具有三個特征:樣本漸趨于總體,精確讓位于模糊,相關(guān)性重于因果。C.從大數(shù)據(jù)存儲與計(jì)算的角度來看,大數(shù)據(jù)具有兩個特征:分布式存儲和分布式并行計(jì)算。D.以上都不對12.某超市曾經(jīng)研究銷售數(shù)據(jù),發(fā)現(xiàn)買商品A的人購買商品B的概率很大,這種屬于數(shù)據(jù)的( )A.聚類分析 B.關(guān)聯(lián)分析 C.分類分析 D.回歸分析13.以下選項(xiàng)中,不屬于大數(shù)據(jù)對人才能力的要求是( )A.業(yè)務(wù)能力B.?dāng)?shù)學(xué)統(tǒng)計(jì)能力C.IT技術(shù)能力D.邏輯思維能力14.?dāng)?shù)據(jù)處理的一般過程是( )。A.采集—分析—整理—可視化表達(dá) B.采集—整理—可視化表達(dá)-分析C.采集—整理—分析-可視化表達(dá) D.采集—可視化表達(dá)—整理-分析15.我們正處于一個大數(shù)據(jù)時代,大數(shù)據(jù)使人們的生活、工作與思維方式等都產(chǎn)生了巨大的變革。那么,從互聯(lián)網(wǎng)思維的角度來看,大數(shù)據(jù)具有特征是( )A.“4V”特征:大量(Volume)、多樣(Variety)、低價值密度(Value)、高速(Velocity)B.樣本漸趨于總體,精確讓位于模糊,相關(guān)性重于因果C.分布式存儲,分布式并行計(jì)算D.沒有特征16.大數(shù)據(jù)( )能從規(guī)模巨大的數(shù)據(jù)中,分析并提取出有潛在價值的信息。A.采集技術(shù) B.分析與挖掘技術(shù) C.預(yù)處理技術(shù) D.可視化與應(yīng)用技術(shù)二、綜合題(共4題)17.大數(shù)據(jù)由于數(shù)據(jù)量大,服務(wù)器一般采用分布式文件存儲或數(shù)據(jù)庫存儲。(____)18.貝葉斯分類算法是統(tǒng)計(jì)學(xué)的一種分類方法,它是一類利用概率統(tǒng)計(jì)知識進(jìn)行分類算法,利用樸素貝葉斯算法可以實(shí)現(xiàn)新聞敏感詞的屏蔽功能。貝葉斯分類屬于大數(shù)據(jù)分析技術(shù)中的數(shù)據(jù)分類技術(shù)。(______)19.疫情期間,國家有關(guān)部門可以通過大數(shù)據(jù)篩選、查找到和感染者有過密切接觸的人,大數(shù)據(jù)一方面方便人們看病問診,另一方面也存在個人信息泄露的風(fēng)險。 (______)20.?dāng)?shù)據(jù)處理的一般過程是明確目標(biāo)、數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)分析及數(shù)據(jù)可視化。(____)參考答案1.C【詳解】本題主要考查大數(shù)據(jù)特征。大數(shù)據(jù)的4V特征分別是Volume(大量性)、Velocity(高速性)、Variety(多樣性)、Value(價值性),故本題選C選項(xiàng)。2.D【詳解】本題主要考查大數(shù)據(jù)的敘述。大數(shù)據(jù)具有數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、商業(yè)價值高、處理速度快,故本題選D選項(xiàng)。3.A【詳解】本題Python相關(guān)知識點(diǎn)IDLE 是 Python 所內(nèi)置的開發(fā)與學(xué)習(xí)環(huán)境,故除了可以通過書中的Jupyter Notebook外,處理數(shù)據(jù)還可以通過Python IDLE工具實(shí)現(xiàn)。故本題選A選項(xiàng)4.C【詳解】本題考查大數(shù)據(jù)。大數(shù)據(jù)(big data),IT行業(yè)術(shù)語,是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模,快速的數(shù)據(jù)流轉(zhuǎn),高質(zhì)量的數(shù)據(jù)要求。本題說法不正確的是選項(xiàng)C。5.B【詳解】本題考查大數(shù)據(jù)的相關(guān)知識點(diǎn)相比計(jì)算機(jī)處理大量數(shù)據(jù),人工處理效率正變得越來越低。故本題選B選項(xiàng)6.C【詳解】本題主要考查數(shù)據(jù)處理。數(shù)據(jù)處理的基本目的是從大量的、雜亂無章的、難以理解的數(shù)據(jù)中抽取出相對有價值、有意義的數(shù)據(jù),故居民身份證號碼可以反映出常住戶口所在地的行政區(qū)劃、出生日期和性別等信息,這主要體現(xiàn)了數(shù)據(jù)是可處理的,故本題選C選項(xiàng)。7.D【詳解】本題考查大數(shù)據(jù)分析的相關(guān)知識點(diǎn)大數(shù)據(jù)分析的方法主要有特征探索、關(guān)聯(lián)分析、聚類與分類。故本題選D選項(xiàng)8.B【詳解】本題主要考查大數(shù)據(jù)處理。處理大數(shù)據(jù)一般采用分治思想;大數(shù)據(jù)采集的是規(guī)模巨大的數(shù)據(jù),不局限于結(jié)構(gòu)化數(shù)據(jù);圖計(jì)算主要針對圖數(shù)據(jù);并行處理能節(jié)省復(fù)雜問題的處理時間,故本題選B選項(xiàng)。9.D【詳解】本題主要考查數(shù)據(jù)相關(guān)知識點(diǎn)。數(shù)據(jù)處理的速度取決于計(jì)算機(jī)硬件設(shè)備和軟件;大數(shù)據(jù)中,并非每個數(shù)據(jù)的價值都非常大;在計(jì)算機(jī)中,并非所有的數(shù)據(jù)都是結(jié)構(gòu)化的;數(shù)據(jù)安全不僅是保障數(shù)據(jù)不損壞,也要考慮數(shù)據(jù)被入侵偷竊的情況,故本題選D選項(xiàng)。10.A【詳解】本題考查的是大數(shù)據(jù)。數(shù)據(jù)或稱巨量資料,指的是需要新處理模式才能具有更強(qiáng)的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。把數(shù)學(xué)算法運(yùn)用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性,選項(xiàng)A正確;大數(shù)據(jù)不是人工智能的一部分,故選項(xiàng)B錯誤;不是一種機(jī)器學(xué)習(xí),故選項(xiàng)C錯誤;大數(shù)據(jù)不能懲罰,故選項(xiàng)D錯誤。11.D【詳解】本題主要考查大數(shù)據(jù)的相關(guān)知識。大數(shù)據(jù)具有“4V”特征,分別是大量(Volume),多樣(Variety),高速(Velocity)、低價值密度(Value),因此A選項(xiàng)正確;從互聯(lián)網(wǎng)思維的角度來看,大數(shù)據(jù)具有三個特征:樣本漸趨于總體,精確讓位于模糊,相關(guān)性重于因果。因此B選項(xiàng)正確;從大數(shù)據(jù)存儲與計(jì)算的角度來看,大數(shù)據(jù)具有兩個特征:分布式存儲和分布式并行計(jì)算。因此C選項(xiàng)正確;由上可知D選項(xiàng)不符合題意。12.B【詳解】本題考查的是數(shù)據(jù)分析。聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā)、自動進(jìn)行分類。關(guān)聯(lián)分析就是分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性,從而描述一個事物中某些屬性同時出現(xiàn)的規(guī)律和模式。數(shù)據(jù)分類是數(shù)據(jù)分析處理中最基本的方法。數(shù)據(jù)分類通常的做法是,基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(也稱為分類器),該分類器具有將分類數(shù)據(jù)項(xiàng)映射到某一特點(diǎn)類別的功能。 回歸分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。某超市曾經(jīng)研究銷售數(shù)據(jù),發(fā)現(xiàn)買商品A的人購買商品B的概率很大,這種屬于數(shù)據(jù)的關(guān)聯(lián)分析。故選項(xiàng)B正確。13.C【詳解】本題考查大數(shù)據(jù)相關(guān)知識點(diǎn)大數(shù)據(jù)對人才能力的要求有業(yè)務(wù)能力、數(shù)學(xué)統(tǒng)計(jì)能力、邏輯思維能力。故本題選C選項(xiàng)14.A【詳解】本題主要考查數(shù)據(jù)處理。數(shù)據(jù)處理的一般過程是采集—分析—整理—可視化表達(dá),故本題選A選項(xiàng)。15.A【詳解】本題主要考查大數(shù)據(jù)的特征。從互聯(lián)網(wǎng)思維的角度來看,大數(shù)據(jù)具有特征是:大量(Volume)、多樣(Variety)、低價值密度(Value)、高速(Velocity),故本題選A選項(xiàng)。16.B【詳解】本題主要考查大數(shù)據(jù)分析知識點(diǎn)。大數(shù)據(jù)分析與挖掘技術(shù)能從規(guī)模巨大的數(shù)據(jù)中,分析并提取出有潛在價值的信息,故本題選B選項(xiàng)。17.√【詳解】本題考查大數(shù)據(jù)存儲相關(guān)知識點(diǎn)大數(shù)據(jù)由于數(shù)據(jù)量大,服務(wù)器一般采用分布式文件存儲或數(shù)據(jù)庫存儲。表述正確18.正確【詳解】本題主要考查大數(shù)據(jù)分析。貝葉斯分類算法是統(tǒng)計(jì)學(xué)的一種分類方法,它是一類利用概率統(tǒng)計(jì)知識進(jìn)行分類算法,利用樸素貝葉斯算法可以實(shí)現(xiàn)新聞敏感詞的屏蔽功能。貝葉斯分類屬于大數(shù)據(jù)分析技術(shù)中的數(shù)據(jù)分類技術(shù),表述正確。19.對【詳解】本題考查大數(shù)據(jù)相關(guān)知識。大數(shù)據(jù)一方面方便數(shù)據(jù)篩選,方便人們的生活,另一方面也存在個人信息泄露的風(fēng)險。題干說法正確。20.錯誤【詳解】本題主要考查數(shù)據(jù)處理的過程。數(shù)據(jù)處理的基本過程是采集、分析、整理、可視化表達(dá),故表述錯誤。 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫