資源簡介 4.2大數(shù)據(jù)處理一、選擇題1.以下關(guān)于數(shù)據(jù)的說法,正確的是( )A.?dāng)?shù)據(jù)處理的速度主要取決于計算機硬件設(shè)備,軟件影響不大B.大數(shù)據(jù)中,每個數(shù)據(jù)的價值都非常大,不能隨意處理C.在計算機中,所有的數(shù)據(jù)都是結(jié)構(gòu)化的D.?dāng)?shù)據(jù)安全不僅是保障數(shù)據(jù)不損壞,也要考慮數(shù)據(jù)被入侵偷竊的情況2.下列關(guān)于大數(shù)據(jù)處理的說法,錯誤的是 ( )A.處理大數(shù)據(jù)一般采用分治思想 B.?dāng)?shù)據(jù)采集只能收集結(jié)構(gòu)化數(shù)據(jù)C.圖計算主要針對圖數(shù)據(jù) D.并行處理能節(jié)省復(fù)雜問題的處理時間3.?dāng)?shù)據(jù)處理的一般過程是( )。A.采集—分析—整理—可視化表達 B.采集—整理—可視化表達-分析C.采集—整理—分析-可視化表達 D.采集—可視化表達—整理-分析4.我們正處于一個大數(shù)據(jù)時代,大數(shù)據(jù)使人們的生活、工作與思維方式等都產(chǎn)生了巨大的變革。那么,從互聯(lián)網(wǎng)思維的角度來看,大數(shù)據(jù)具有特征是( )A.“4V”特征:大量(Volume)、多樣(Variety)、低價值密度(Value)、高速(Velocity)B.樣本漸趨于總體,精確讓位于模糊,相關(guān)性重于因果C.分布式存儲,分布式并行計算D.沒有特征5.大數(shù)據(jù)的特征可以用被總結(jié)為4V特征,以下哪個不屬于大數(shù)據(jù)的4V特征( )A.種類多(Variety) B.體量大(Volume)C.風(fēng)險大(Venture) D.速度快(Velocity)6.下列關(guān)于大數(shù)據(jù)的描述中,不正確的是( )A.大數(shù)據(jù)專指Excel軟件收集、加工的數(shù)據(jù)B.物聯(lián)網(wǎng)、云計算、手機、電腦都是數(shù)據(jù)的來源C.互聯(lián)網(wǎng)生成的數(shù)據(jù)量正以爆發(fā)性的速度不斷增長D.在科學(xué)實驗中,各種傳感器每時每刻的速度不斷增長7.居民身份證號碼可以反映出常住戶口所在地的行政區(qū)劃、出生日期和性別等信息,這主要體現(xiàn)了數(shù)據(jù)是( )。A.計算工具識別、存儲和加工的對象 B.信息的載體 C.可處理的 D.可加工的8.大數(shù)據(jù)( )能從規(guī)模巨大的數(shù)據(jù)中,分析并提取出有潛在價值的信息。A.采集技術(shù) B.分析與挖掘技術(shù) C.預(yù)處理技術(shù) D.可視化與應(yīng)用技術(shù)9.隨著時代的發(fā)展,各行各業(yè)需要處理的的數(shù)據(jù)量快速增長,人工處理大量數(shù)據(jù)的效率與用計算機處理大量數(shù)據(jù)相比較,人工處理效率正變得( )。A.更高 B.更低 C.一樣 D.無法比較10.大數(shù)據(jù)不是要教機器像人一樣思考。相反,它是( )A.把數(shù)學(xué)算法運用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性。B.被視為人工智能的一部分。C.被視為一種機器學(xué)習(xí)。D.預(yù)測與懲罰。11.以下選項中,不屬于大數(shù)據(jù)對人才能力的要求是( )A.業(yè)務(wù)能力B.?dāng)?shù)學(xué)統(tǒng)計能力C.IT技術(shù)能力D.邏輯思維能力12.某超市曾經(jīng)研究銷售數(shù)據(jù),發(fā)現(xiàn)買商品A的人購買商品B的概率很大,這種屬于數(shù)據(jù)的( )A.聚類分析 B.關(guān)聯(lián)分析 C.分類分析 D.回歸分析13.大數(shù)據(jù)時代已經(jīng)在悄悄地改變我們的日常生活,也使人們?nèi)粘I罡鼮楸憬荩缫苿又Ц丁⒕W(wǎng)絡(luò)約車出行、網(wǎng)絡(luò)購物、網(wǎng)絡(luò)預(yù)約掛號等。以下不屬于大數(shù)據(jù)分析的是( )A.特征探索 B.關(guān)聯(lián)分析 C.聚類與分類 D.建模分析14.在教科書中利用Python探究電流和電壓、電阻的關(guān)系實驗里,除了可以通過書中的Jupyter Notebook外,處理數(shù)據(jù)還可以通過下列( )工具實現(xiàn)。A.Python IDLE B.Xmind C.網(wǎng)絡(luò)畫板 D.幾何畫板15.下列對大數(shù)據(jù)的理解錯誤的是( )。A.從互聯(lián)網(wǎng)產(chǎn)生大數(shù)據(jù)的角度來看,大數(shù)據(jù)具有“4V”特征,分別是大量(Volume),多樣(Variety),低價值密度(Value),高速(Velocity)。B.從互聯(lián)網(wǎng)思維的角度來看,大數(shù)據(jù)具有三個特征:樣本漸趨于總體,精確讓位于模糊,相關(guān)性重于因果。C.從大數(shù)據(jù)存儲與計算的角度來看,大數(shù)據(jù)具有兩個特征:分布式存儲和分布式并行計算。D.以上都不對16.對于大數(shù)據(jù)特征的描述,不正確的是( )。A.海量的數(shù)據(jù)規(guī)模(巨量性) B.快速的數(shù)據(jù)流轉(zhuǎn)(迅變性)C.單一的數(shù)據(jù)類型(單一性) D.高質(zhì)量的數(shù)據(jù)要求(真實性)二、判斷題17.貝葉斯分類算法是統(tǒng)計學(xué)的一種分類方法,它是一類利用概率統(tǒng)計知識進行分類算法,利用樸素貝葉斯算法可以實現(xiàn)新聞敏感詞的屏蔽功能。貝葉斯分類屬于大數(shù)據(jù)分析技術(shù)中的數(shù)據(jù)分類技術(shù)。(______)18.?dāng)?shù)據(jù)處理的一般過程是明確目標(biāo)、數(shù)據(jù)采集、數(shù)據(jù)加工、數(shù)據(jù)分析及數(shù)據(jù)可視化。(____)19.大數(shù)據(jù)由于數(shù)據(jù)量大,服務(wù)器一般采用分布式文件存儲或數(shù)據(jù)庫存儲。(____)20.疫情期間,國家有關(guān)部門可以通過大數(shù)據(jù)篩選、查找到和感染者有過密切接觸的人,大數(shù)據(jù)一方面方便人們看病問診,另一方面也存在個人信息泄露的風(fēng)險。 (______)參考答案1.D【詳解】本題主要考查數(shù)據(jù)相關(guān)知識點。數(shù)據(jù)處理的速度取決于計算機硬件設(shè)備和軟件;大數(shù)據(jù)中,并非每個數(shù)據(jù)的價值都非常大;在計算機中,并非所有的數(shù)據(jù)都是結(jié)構(gòu)化的;數(shù)據(jù)安全不僅是保障數(shù)據(jù)不損壞,也要考慮數(shù)據(jù)被入侵偷竊的情況,故本題選D選項。2.B【詳解】本題主要考查大數(shù)據(jù)處理。處理大數(shù)據(jù)一般采用分治思想;大數(shù)據(jù)采集的是規(guī)模巨大的數(shù)據(jù),不局限于結(jié)構(gòu)化數(shù)據(jù);圖計算主要針對圖數(shù)據(jù);并行處理能節(jié)省復(fù)雜問題的處理時間,故本題選B選項。3.A【詳解】本題主要考查數(shù)據(jù)處理。數(shù)據(jù)處理的一般過程是采集—分析—整理—可視化表達,故本題選A選項。4.A【詳解】本題主要考查大數(shù)據(jù)的特征。從互聯(lián)網(wǎng)思維的角度來看,大數(shù)據(jù)具有特征是:大量(Volume)、多樣(Variety)、低價值密度(Value)、高速(Velocity),故本題選A選項。5.C【詳解】本題主要考查大數(shù)據(jù)特征。大數(shù)據(jù)的4V特征分別是Volume(大量性)、Velocity(高速性)、Variety(多樣性)、Value(價值性),故本題選C選項。6.A【詳解】本題主要考查大數(shù)據(jù)的描述。大數(shù)據(jù)是指無法在可承受的時間范圍內(nèi)用常規(guī)軟件工具進行高效捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更佳的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn);物聯(lián)網(wǎng)、云計算、手機、電腦都是數(shù)據(jù)的來源;互聯(lián)網(wǎng)生成的數(shù)據(jù)量正以爆發(fā)性的速度不斷增長;在科學(xué)實驗中,各種傳感器每時每刻的速度不斷增長,故本題選A選項。7.C【詳解】本題主要考查數(shù)據(jù)處理。數(shù)據(jù)處理的基本目的是從大量的、雜亂無章的、難以理解的數(shù)據(jù)中抽取出相對有價值、有意義的數(shù)據(jù),故居民身份證號碼可以反映出常住戶口所在地的行政區(qū)劃、出生日期和性別等信息,這主要體現(xiàn)了數(shù)據(jù)是可處理的,故本題選C選項。8.B【詳解】本題主要考查大數(shù)據(jù)分析知識點。大數(shù)據(jù)分析與挖掘技術(shù)能從規(guī)模巨大的數(shù)據(jù)中,分析并提取出有潛在價值的信息,故本題選B選項。9.B【詳解】本題考查大數(shù)據(jù)的相關(guān)知識點相比計算機處理大量數(shù)據(jù),人工處理效率正變得越來越低。故本題選B選項10.A【詳解】本題考查的是大數(shù)據(jù)。數(shù)據(jù)或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。把數(shù)學(xué)算法運用到海量的數(shù)據(jù)上來預(yù)測事情發(fā)生的可能性,選項A正確;大數(shù)據(jù)不是人工智能的一部分,故選項B錯誤;不是一種機器學(xué)習(xí),故選項C錯誤;大數(shù)據(jù)不能懲罰,故選項D錯誤。11.C【詳解】本題考查大數(shù)據(jù)相關(guān)知識點大數(shù)據(jù)對人才能力的要求有業(yè)務(wù)能力、數(shù)學(xué)統(tǒng)計能力、邏輯思維能力。故本題選C選項12.B【詳解】本題考查的是數(shù)據(jù)分析。聚類分析是一種探索性的分析,在分類的過程中,人們不必事先給出一個分類的標(biāo)準(zhǔn),聚類分析能夠從樣本數(shù)據(jù)出發(fā)、自動進行分類。關(guān)聯(lián)分析就是分析并發(fā)現(xiàn)存在于大量數(shù)據(jù)之間的關(guān)聯(lián)性或相關(guān)性,從而描述一個事物中某些屬性同時出現(xiàn)的規(guī)律和模式。數(shù)據(jù)分類是數(shù)據(jù)分析處理中最基本的方法。數(shù)據(jù)分類通常的做法是,基于樣本數(shù)據(jù)先訓(xùn)練構(gòu)建分類函數(shù)或者分類模型(也稱為分類器),該分類器具有將分類數(shù)據(jù)項映射到某一特點類別的功能。 回歸分析是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。某超市曾經(jīng)研究銷售數(shù)據(jù),發(fā)現(xiàn)買商品A的人購買商品B的概率很大,這種屬于數(shù)據(jù)的關(guān)聯(lián)分析。故選項B正確。13.D【詳解】本題考查大數(shù)據(jù)分析的相關(guān)知識點大數(shù)據(jù)分析的方法主要有特征探索、關(guān)聯(lián)分析、聚類與分類。故本題選D選項14.A【詳解】本題Python相關(guān)知識點IDLE 是 Python 所內(nèi)置的開發(fā)與學(xué)習(xí)環(huán)境,故除了可以通過書中的Jupyter Notebook外,處理數(shù)據(jù)還可以通過Python IDLE工具實現(xiàn)。故本題選A選項15.D【詳解】本題主要考查大數(shù)據(jù)的相關(guān)知識。大數(shù)據(jù)具有“4V”特征,分別是大量(Volume),多樣(Variety),高速(Velocity)、低價值密度(Value),因此A選項正確;從互聯(lián)網(wǎng)思維的角度來看,大數(shù)據(jù)具有三個特征:樣本漸趨于總體,精確讓位于模糊,相關(guān)性重于因果。因此B選項正確;從大數(shù)據(jù)存儲與計算的角度來看,大數(shù)據(jù)具有兩個特征:分布式存儲和分布式并行計算。因此C選項正確;由上可知D選項不符合題意。16.C【詳解】本題考查大數(shù)據(jù)。大數(shù)據(jù)(big data),IT行業(yè)術(shù)語,是指無法在一定時間范圍內(nèi)用常規(guī)軟件工具進行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)。大數(shù)據(jù)具有海量的數(shù)據(jù)規(guī)模,快速的數(shù)據(jù)流轉(zhuǎn),高質(zhì)量的數(shù)據(jù)要求。本題說法不正確的是選項C。17.正確【詳解】本題主要考查大數(shù)據(jù)分析。貝葉斯分類算法是統(tǒng)計學(xué)的一種分類方法,它是一類利用概率統(tǒng)計知識進行分類算法,利用樸素貝葉斯算法可以實現(xiàn)新聞敏感詞的屏蔽功能。貝葉斯分類屬于大數(shù)據(jù)分析技術(shù)中的數(shù)據(jù)分類技術(shù),表述正確。18.錯誤【詳解】本題主要考查數(shù)據(jù)處理的過程。數(shù)據(jù)處理的基本過程是采集、分析、整理、可視化表達,故表述錯誤。19.√【詳解】本題考查大數(shù)據(jù)存儲相關(guān)知識點大數(shù)據(jù)由于數(shù)據(jù)量大,服務(wù)器一般采用分布式文件存儲或數(shù)據(jù)庫存儲。表述正確20.對【詳解】本題考查大數(shù)據(jù)相關(guān)知識。大數(shù)據(jù)一方面方便數(shù)據(jù)篩選,方便人們的生活,另一方面也存在個人信息泄露的風(fēng)險。題干說法正確。 展開更多...... 收起↑ 資源預(yù)覽 縮略圖、資源來源于二一教育資源庫