資源簡介 數據處理與應用大單元——大數據處理與應用鞏固練習班級 姓名1.下列關于大數據思維的說法,錯誤的是( )A.大數據要分析的是全體數據 B.大數據追求數據的精確性C.大數據注重事物之間的相關性 D.大數據能夠接受數據的混雜性2.下列關于大數據的說法錯誤的是( )A.更注重事物的相關性而不是因果關系B.不再追求個別數據的精確性,允許數據混雜C.速度快是大數據的特征之一,僅指數據的產生速度快D.大數據要分析的是全體數據,而不是抽樣數據3.下列關于大數據的描述中,不正確的是( )A.某學校的高考報名數據屬于大數據B.處理大數據時,一般采用分治思想C.大數據的速度快不僅指數據產生的速度快,還指數據處理的速度快D.Hadoop是一個可運行于大規模計算機集群上的分布式系統基礎架構4.同一小區中發現有新冠病例,其他住戶的健康碼馬上會變色,這主要得意于( )A.數據體量大 B.價值密度高 C.數據處理的速度快 D.數據產生的速度快5.谷歌開發了一個名為“谷歌流感”的工具,其原理為,對所有使用搜索引擎搜索如溫度計、流感癥狀、肌肉疼痛、胸悶等關鍵詞的用戶展開追蹤分析,創建大數據流感地圖,進行相關性預測。綜合上述事例,大數據分析注重的是( )A.精確性 B.相關性 C.必然性 D.因果關系6.有關部門使用大數據技術,進行疫情防控,有關大數據的說法不正確的是( )A.相關機構實時采集各地相關數據,每天發布疫情數據,用到了大數據技術B.大數據要分析的是全體數據C.超市、商場、醫院等場所,使用手持設備測量入場人員體溫,使用了大數據技術D.有群眾沒有去過疫情中高風險地區,也未接觸過確診病例,但健康碼變色了,說明大數據允許個別不準確數據存在7.關于大數據思維的描述,下列不正確的是( )A.大數據代表著信息量大、速度快、種類繁多的信息資產,需要特定的技術和分析方法將其轉化為價值B.價值密度低是大數據特征之一,價值密度的高低與數據總量的大小成正比C.大數據要分析的是全體數據,而不是抽樣數據D.大數據更關注事物的相關性而不是因果關系8.關于大數據處理,下列說法不正確的是( )A.處理大數據時,一般采用分治思想B.數據的可視化可以幫助用戶更快捷觀察與追蹤數據C.文本數據處理時需要將非結構化的文本原始狀態轉化成結構化數據D.對圖結構的數據一般采用流計算模式進行處理9.有關部門使用大數據技術,進行疫情防控,有關大數據的說法不正確的是( )A.相關機構實時采集各地相關數據,每天發布疫情數據,沒有用到大數據技術B.大數據要分析的是個別具體數據C.超市、商場、醫院等場所,使用手持設備測量入場人員體溫,使用了傳感技術而沒有用到大數據技術D.部分群眾沒有去過疫情中高風險地區,也未接觸過確診病例等,但健康碼變色了,說明大數據處理技術還十分不成熟10.下列關于大數據的描述,正確的是( )A.處理大數據的基本思路是分治的思想B.Hadoop、Spark 適用于實時數據的流計算C.大數據蘊含巨大價值,故價值密度相對較高D.大數據因數據體量大,只能抽樣處理11.下列關于大數據的說法,正確的是( )A.大數據包括靜態數據、流數據兩種類型B.大數據蘊含著巨大的價值,但其價值密度較低C.分布式數據庫 HBase 主要用來存儲結構化數據D.大數據給生活帶來便利,也讓用戶的個人隱私受到更好的保護12.在抗擊疫情的戰斗中,大數據充分發揮了其數據量大、速度快、類型多等優勢,特別是在對密切接觸者的判斷和查找中發揮了巨大的作用,下列發現密切接觸者的場景中沒有體現大數據的是( )A.利用手機基站獲取的定位信息B.利用藥店紙質登記的個人信息C.利用購票、乘車信息獲取的出行信息D.利用人臉識別獲取進出商店的人員信息13.下列應用的數據屬于圖計算處理的是( )A.某傳染病的傳播路徑B.高速公路每時每刻的車流量C.購物網站的廣告推薦D.已經搜集的某商品的月成交額14.下列選項中,哪個不是大數據的典型應用( )A.基于交易大數據分析用戶的購買習慣B.基于搜索引擎的搜索關鍵詞分析社會熱點C.基于道路攝像頭、地感線圈等數據分析城市交通情況D.基于科技文獻數據庫檢索某一領域研究進展15.下列有關大數據及其處理的說法,錯誤的是( )A.大數據的四個特征:數據規模大、處理速度快、數據類型多、價值密度低B.對大數據進行處理時,必須保證每個數據都準確無誤C.批處理計算適合處理靜態數據D.流計算適合處理實時更新的數據16.下列關于Hadoop架構的描述正確的是( )A.不能運行于大規模計算機集群上B.采用NTFS文件系統管理數據文件C.是一個對大數據進行聚合式處理的基礎軟件框架D.采用MapReduce編程模型處理大規模數據集17.無人駕駛汽車能夠收集周圍地形的相關信息,并能快速作出行駛決策,主要體現了大數據的哪一特征( )A.大數據收集和分析的數據量非常大 B.數據處理的速度快C.大數據的數據來源多 D.大數據的價值密度相對較低18.關于大數據與人工智能,下列說法正確的是( )A.大數據的體量越大,價值密度就越高B.深度學習是對原始數據所蘊含和特征模式進行學習的算法模型C.大數據實現商品個性化推薦的過程中,首先需要從數據中分析出人們購買商品的原因D.Hadoop的設計初衷是面向實時處理的流數據19.目前,云盤和網盤的底層一般采用( )實現A.分布式并行計算模型 MapReduce B.分布式文件系統 HDFSC.分布式數據庫 Hbase D.流計算20.有關大數據的文本數據處理,下列說法正確的是( )A.jieba 模塊的分詞算法屬于基于統計的分詞方法B.大數據文本情感分析是電腦將自己的情感表現出來C.文本處理過程中一般先進行數據分析,再分詞、提取特征,最后呈現結果D.標簽云一般根據詞頻表現文本特征,以文字大小代表詞語的重要性21.下列關于中文分詞方法的描述中,屬于基于統計的分詞方法的是( )A.在分析句子時與詞典中的詞語進行對比,詞典中出現的就劃分為詞B.依據上下文中相鄰字出現的頻率統計,同時出現的次數越高就越可能組成一個詞C.讓計算機模擬人的理解方式,根據大量的現有資料和規則進行學習,然后分詞D.依據詞語與詞語之間的空格進行分詞022 年的北京冬奧會,我國取得了歷史最好成績,人工智能技術也以科技手段助運動員們一臂之力。研究團隊利用基于深度學習原理的人工智能技術,建立神經網絡模型,實現對動作視頻中人體關節點的計算機自動識別,進而建立起適用于競技體育和一般生物力學研究的計算機系統——無反光點人體運動自動捕捉人工智能系統。目前該系統已應用在國家速度滑冰和越野滑雪項目的訓練中,獲得超過 8000 人次的賽時動作技術數據,使機器深度學習越發"得心應手",對于滑冰與滑雪運動員的動作捕捉與技術分析,既能精準到具體細節,又能快速反饋分析結果。請回答第22和23題。22.根據以上描述,下列說法不正確的是( )A.隨著獲取的動作數據逐漸增加,該技術對于數據的反饋會更有效B.該技術主要體現動作與結果的關系,說明大數據更注重事物之間的相關性C.該技術捕捉到的每一個數據都來自于真實數據,體現了大數據價值密度高的特點D.能根據動作自動捕捉進行分析,并快速反饋分析結果,體現了大數據速度快的特點23.根據以上描述,人工智能技術助力運動員主要基于以下哪種方法( )A.符號主義 B.聯結主義 C.行為主義 D.建構主義24.下列對關于大數據和人工智能的說法正確的是( )A.大數據肯定可以用Hadoop來處理B.對圖結構的數據,一般采用流計算模式進行處理C.掃地機器人在運動中不斷從環境學習,屬于行為主義人工智能D.達芬奇外科手術機器人,屬于領域人工智能25.下列說法正確的是( )A.HDFS 是一個容錯性較低的系統,適合部署在廉價的機器上B.MapReduce 是一種聚合式的并行編程模型C.Twitter 架構實現了批處理系統與流計算在一個平臺架構下的整合D.標簽云是通過給特征詞賦予權重進行統計分析26.下列說法正確的是( )A.文本數據處理時可以通過特征提取提高文本處理的速度和效率B.學生選課系統中存放的大量數據屬于大數據C.大數據要求所有處理的數據都是精確的D.領域人工智能指智能系統從一個領域快速跨越到另外一個領域數據處理與應用大單元——大數據處理與應用鞏固練習班級 姓名1.下列關于大數據思維的說法,錯誤的是( B )A.大數據要分析的是全體數據 B.大數據追求數據的精確性C.大數據注重事物之間的相關性 D.大數據能夠接受數據的混雜性2.下列關于大數據的說法錯誤的是( C )A.更注重事物的相關性而不是因果關系B.不再追求個別數據的精確性,允許數據混雜C.速度快是大數據的特征之一,僅指數據的產生速度快D.大數據要分析的是全體數據,而不是抽樣數據3.下列關于大數據的描述中,不正確的是( A )A.某學校的高考報名數據屬于大數據B.處理大數據時,一般采用分治思想C.大數據的速度快不僅指數據產生的速度快,還指數據處理的速度快D.Hadoop是一個可運行于大規模計算機集群上的分布式系統基礎架構4.同一小區中發現有新冠病例,其他住戶的健康碼馬上會變色,這主要得意于( C )A.數據體量大 B.價值密度高 C.數據處理的速度快 D.數據產生的速度快5.谷歌開發了一個名為“谷歌流感”的工具,其原理為,對所有使用搜索引擎搜索如溫度計、流感癥狀、肌肉疼痛、胸悶等關鍵詞的用戶展開追蹤分析,創建大數據流感地圖,進行相關性預測。綜合上述事例,大數據分析注重的是( B )A.精確性 B.相關性 C.必然性 D.因果關系6.有關部門使用大數據技術,進行疫情防控,有關大數據的說法不正確的是( C )A.相關機構實時采集各地相關數據,每天發布疫情數據,用到了大數據技術B.大數據要分析的是全體數據C.超市、商場、醫院等場所,使用手持設備測量入場人員體溫,使用了大數據技術D.有群眾沒有去過疫情中高風險地區,也未接觸過確診病例,但健康碼變色了,說明大數據允許個別不準確數據存在7.關于大數據思維的描述,下列不正確的是( B )A.大數據代表著信息量大、速度快、種類繁多的信息資產,需要特定的技術和分析方法將其轉化為價值B.價值密度低是大數據特征之一,價值密度的高低與數據總量的大小成正比C.大數據要分析的是全體數據,而不是抽樣數據D.大數據更關注事物的相關性而不是因果關系8.關于大數據處理,下列說法不正確的是( D )A.處理大數據時,一般采用分治思想B.數據的可視化可以幫助用戶更快捷觀察與追蹤數據C.文本數據處理時需要將非結構化的文本原始狀態轉化成結構化數據D.對圖結構的數據一般采用流計算模式進行處理9.有關部門使用大數據技術,進行疫情防控,有關大數據的說法正確的是( C )A.相關機構實時采集各地相關數據,每天發布疫情數據,沒有用到大數據技術B.大數據要分析的是個別具體數據C.超市、商場、醫院等場所,使用手持設備測量入場人員體溫,使用了傳感技術而沒有用到大數據技術D.部分群眾沒有去過疫情中高風險地區,也未接觸過確診病例等,但健康碼變色了,說明大數據處理技術還十分不成熟10.下列關于大數據的描述,正確的是( A )A.處理大數據的基本思路是分治的思想B.Hadoop、Spark 適用于實時數據的流計算C.大數據蘊含巨大價值,故價值密度相對較高D.大數據因數據體量大,只能抽樣處理11.下列關于大數據的說法,正確的是( B )A.大數據只包括靜態數據、流數據兩種類型B.大數據蘊含著巨大的價值,但其價值密度較低C.分布式數據庫 HBase 主要用來存儲結構化數據D.大數據給生活帶來便利,也讓用戶的個人隱私受到更好的保護12.在抗擊疫情的戰斗中,大數據充分發揮了其數據量大、速度快、類型多等優勢,特別是在對密切接觸者的判斷和查找中發揮了巨大的作用,下列發現密切接觸者的場景中沒有體現大數據的是( B )A.利用手機基站獲取的定位信息B.利用藥店紙質登記的個人信息C.利用購票、乘車信息獲取的出行信息D.利用人臉識別獲取進出商店的人員信息13.下列應用的數據屬于圖計算處理的是( A )A.某傳染病的傳播路徑B.高速公路每時每刻的車流量C.購物網站的廣告推薦D.已經搜集的某商品的月成交額14.下列選項中,哪個不是大數據的典型應用( D )A.基于交易大數據分析用戶的購買習慣B.基于搜索引擎的搜索關鍵詞分析社會熱點C.基于道路攝像頭、地感線圈等數據分析城市交通情況D.基于科技文獻數據庫檢索某一領域研究進展15.下列有關大數據及其處理的說法,錯誤的是( B )A.大數據的四個特征:數據規模大、處理速度快、數據類型多、價值密度低B.對大數據進行處理時,必須保證每個數據都準確無誤C.批處理計算適合處理靜態數據D.流計算適合處理實時更新的數據16.下列關于Hadoop架構的描述正確的是( D )A.不能運行于大規模計算機集群上B.采用NTFS文件系統管理數據文件C.是一個對大數據進行聚合式處理的基礎軟件框架D.采用MapReduce編程模型處理大規模數據集17.無人駕駛汽車能夠收集周圍地形的相關信息,并能快速作出行駛決策,主要體現了大數據的哪一特征( B )A.大數據收集和分析的數據量非常大 B.數據處理的速度快C.大數據的數據來源多 D.大數據的價值密度相對較低18.關于大數據與人工智能,下列說法正確的是( B )A.大數據的體量越大,價值密度就越高B.深度學習是對原始數據所蘊含和特征模式進行學習的算法模型C.大數據實現商品個性化推薦的過程中,首先需要從數據中分析出人們購買商品的原因D.Hadoop的設計初衷是面向實時處理的流數據19.目前,云盤和網盤的底層一般采用( B )實現A.分布式并行計算模型 MapReduce B.分布式文件系統 HDFSC.分布式數據庫 Hbase D.流計算20.有關大數據的文本數據處理,下列說法正確的是( D )A.jieba 模塊的分詞算法屬于基于統計的分詞方法B.大數據文本情感分析是電腦將自己的情感表現出來C.文本處理過程中一般先進行數據分析,再分詞、提取特征,最后呈現結果D.標簽云一般根據詞頻表現文本特征,以文字大小代表詞語的重要性21.下列關于中文分詞方法的描述中,屬于基于統計的分詞方法的是( B )A.在分析句子時與詞典中的詞語進行對比,詞典中出現的就劃分為詞B.依據上下文中相鄰字出現的頻率統計,同時出現的次數越高就越可能組成一個詞C.讓計算機模擬人的理解方式,根據大量的現有資料和規則進行學習,然后分詞D.依據詞語與詞語之間的空格進行分詞022 年的北京冬奧會,我國取得了歷史最好成績,人工智能技術也以科技手段助運動員們一臂之力。研究團隊利用基于深度學習原理的人工智能技術,建立神經網絡模型,實現對動作視頻中人體關節點的計算機自動識別,進而建立起適用于競技體育和一般生物力學研究的計算機系統——無反光點人體運動自動捕捉人工智能系統。目前該系統已應用在國家速度滑冰和越野滑雪項目的訓練中,獲得超過 8000 人次的賽時動作技術數據,使機器深度學習越發"得心應手",對于滑冰與滑雪運動員的動作捕捉與技術分析,既能精準到具體細節,又能快速反饋分析結果。請回答第22和23題。22.根據以上描述,下列說法不正確的是( C )A.隨著獲取的動作數據逐漸增加,該技術對于數據的反饋會更有效B.該技術主要體現動作與結果的關系,說明大數據更注重事物之間的相關性C.該技術捕捉到的每一個數據都來自于真實數據,體現了大數據價值密度高的特點D.能根據動作自動捕捉進行分析,并快速反饋分析結果,體現了大數據速度快的特點23.根據以上描述,人工智能技術助力運動員主要基于以下哪種方法( B )A.符號主義 B.聯結主義 C.行為主義 D.建構主義24.下列對關于大數據和人工智能的說法正確的是( C )A.大數據肯定可以用Hadoop來處理B.對圖結構的數據,一般采用流計算模式進行處理C.掃地機器人在運動中不斷從環境學習,屬于行為主義人工智能D.達芬奇外科手術機器人,屬于領域人工智能25.下列說法正確的是( C )A.HDFS 是一個容錯性較低的系統,適合部署在廉價的機器上B.MapReduce 是一種聚合式的并行編程模型C.Twitter 架構實現了批處理系統與流計算在一個平臺架構下的整合D.標簽云是通過給特征詞賦予權重進行統計分析26.下列說法正確的是( A )A.文本數據處理時可以通過特征提取提高文本處理的速度和效率B.學生選課系統中存放的大量數據屬于大數據C.大數據要求所有處理的數據都是精確的D.領域人工智能指智能系統從一個領域快速跨越到另外一個領域 展開更多...... 收起↑ 資源列表 浙教版新教材(2019)《數據與計算》選考一輪復習 學考復習配套練習——大數據及處理應用鞏固練習.docx 浙教版新教材(2019)《數據與計算》選考一輪復習 學考復習配套練習——大數據及處理應用鞏固練習答案.docx 縮略圖、資源來源于二一教育資源庫