資源簡介 粵教版 必修1 第五章 數據處理和可視化表達 單元練習學校:___________姓名:___________班級:___________考號:___________一、選擇題1.下列選項中,哪個不是大數據的典型應用( )A.基于交易大數據分析用戶的購買習慣B.基于搜索引擎的搜索關鍵詞分析社會熱點C.基于道路攝像頭、地感線圈等數據分析城市交通情況D.基于科技文獻數據庫檢索某一領域研究進展2.有關大數據的說法,下列正確的是( )A.大數據一般用于分析抽樣數據 B.大數據采集的數據都是結構化數據C.大數據更加注重事物的相關性 D.用大數據進行處理時,必須保證每個數據都準確無誤3.大數據已經進入了人們的生活,關于大數據的說法,不正確的是( )A.大數據是未來信息技術產業的一種原料,可以從中提取很多有效信息B.在很多情況下,大數據的來源可以不依靠人工C.大數據信息量很大,蘊藏的信息價值密度高D.在大數據中,個別極端數據不會影響大數據分析結果4.2022年北京冬季奧運會圓滿結束,這不僅是一場體育盛會,也是一場文化盛宴、科技盛會。從充滿文化韻味的“二十四節氣”倒計時,到脫胎于篆刻、書法的冬奧標識;從創意源于西漢長信宮燈的冬奧會火炬接力火種燈,到取自《千里江山圖》的冰場擋板圖案,從展現文明交流交融的“黃河之水”,到最終幻化成“冰雪五環”……中華文化與奧運文化、冰雪元素完美融合,閃耀冬奧舞臺,寫下文明交流互鑒的新篇章。小明使用百度指數,以“冬奧會比賽項目”為關鍵詞進行分析,得到大家對于比賽項目關注情況的圖譜(如圖),以數據可視化形式迅速展示要點信息。該圖譜采用的是( )A.詞云分布圖 B.網絡關系圖 C.雷達圖 D.熱力圖5.2020年12月31日,國家主席習近平發表了2021年新年賀詞,賀詞的詞云圖如下列說法錯誤的是( )A.在整篇賀詞中,“我們”一詞是被提的最多的B.詞云圖顯示了賀詞中出現的所有詞語C.詞云圖可以通過文字大小、字體顏色來展現詞語出現的頻率D.詞云圖是一種將文本進行可視化表達的方式6.有關某“無人超市”的信息系統結構圖如圖所示,下列有關“無人超市”的說法,正確的是( )A.系統通過入口處刷臉獲得的特征值屬于個人一般信息B.零購物碼和出門二維碼使用后失效,體現了信息的時效性C.系統自動對用戶數據進行加密是為了提高數據的完整性D.存儲在系統數據庫中的海量用戶信息屬于大數據7.2022年北京冬季奧運會圓滿結束,這不僅是一場體育盛會,也是一場文化盛宴、科技盛會。從充滿文化韻味的“二十四節氣”倒計時,到脫胎于篆刻、書法的冬奧標識;從創意源于西漢長信宮燈的冬奧會火炬接力火種燈,到取自《千里江山圖》的冰場擋板圖案,從展現文明交流交融的“黃河之水”,到最終幻化成“冰雪五環”……中華文化與奧運文化、冰雪元素完美融合,閃耀冬奧舞臺,寫下文明交流互鑒的新篇章。通過統計分析海量網民在網上行為數據,百度發布《百度熱搜·北京冬奧會大數據》,以此了解人們對北京冬奧會的關注熱度。說明大數據時代強調( )A.尋找事物之間的因果關系,而不是相關關系 B.追求數據的精確性,而不是模糊性C.要分析的是全體數據,而不是抽樣數據 D.數據價值密度的高低與數據總量的大小成正比關系8.因疫情防控需要,學校要求學生家長及時上報體溫、行程等數據,匯總后上報上級防控部門,采集上述數據最為高效的方法是( )A.填寫在線收集表 B.填寫紙質表格 C.發送電子郵件 D.打電話上報9.下列關于大數據的描述中,不正確的是( )A.大數據專指Excel軟件收集、加工的數據B.物聯網、云計算、手機、電腦都是數據的來源C.互聯網生成的數據量正以爆發性的速度不斷增長D.在科學實驗中,各種傳感器每時每刻的速度不斷增長10.下列有關大數據的說法,正確的是( )A.大數據采集的數據有結構化、半結構化和非結構化的。B.大數據的分析是抽樣數據。C.用大數據進行數據處理時,必須保證每個數據都準確無誤。D.在大數據時代,數據的主要來源還是人力。11.在高中學習《信息技術》課程后,張明對數據搜索、整理、分析和預測方面產生了濃厚的興趣,想報考大學的數據相關專業,請判斷以下專業中與大數據最貼近的是( )A.漢語言文學專業 B.統計專業 C.化學專業 D.歷史專業12.“抖音”APP會針對用戶喜好推送視頻。該推送功能是基于對大數據的分析,在進行大數據分析時不需要的操作是( )A.收集、分析用戶在不同視頻上停留的時間 B.分析關鍵詞所屬的視頻類別C.采集用戶搜索的關鍵詞 D.統計用戶使用抖音的時間13.下列設備適合采集視頻素材的是( )A.打印機,繪圖儀 B.掃描儀,數碼相機 C.話筒,音箱 D.智能手機,數碼攝像機14.2022年,我國新冠疫情形勢依然嚴峻,在疫情防控面前,大數據提供了科技支撐,助力疫情精準防控。下列應用中沒有用到大數據技術的是( )A.利用“城市熱力圖”,避開人流密度高的地區B.超市用手持測溫儀測量進場人員體溫C.繪制確診病人的行動軌跡,查找密接者D.政府實時采集數據進行疫情信息發布15.以下關于對大數據特點的敘述中不正確的是( )A.數據價值密度高 B.數據類型多樣 C.數據處理速度快 D.數據規模大16.標簽云(詞云)用詞頻表現文本特征,將關鍵詞按照一定的順序和規律排列,并以文字大小的 形式代表詞語的重要性。下列不適合用標簽云(詞云)來呈現的是( )A.政府年度工作報告中的關鍵詞B.學生期末考試成績C.《全唐詩》常用的詞語D.《紅樓夢》中人物出現的次數17.下列關于大數據的說法錯誤的是( )A.大數據僅僅是數據的體量大 B.大數據可以幫助傳統行業C.大數據會帶來機器智能 D.大數據是一種思維方式18.下列關于數據的說法,正確的是( )A.計算機數據管理主要經歷了人工管理、文件管理、大數據管理三個階段B.MD5、CRC、SHA-1 是常用的數據加密算法C.靜態數據常在計算時不會發生改變,流數據的價值隨時間增加D.文本數據處理過程主要包括分詞、特征提取、數據分析、結果呈現19.數據的采集方法有人工獲取和自動采集,下列哪一個不是自動采集的是( )。A.物聯感知 B.視頻監控 C.文獻調研 D.網絡平臺20.有關部門使用大數據技術,進行疫情防控,有關大數據的說法不正確的是( )A.相關機構實時采集各地相關數據,每天發布疫情數據,用到了大數據技術。B.大數據要分析的是全體數據。C.超市、商場、醫院等場所,使用手持設備測量入場人員體溫,使用了大數據技術。D.疫情期間,部分群眾沒有去過中高風險地區,也沒有接觸過確診病例等,但健康碼變色了,說明大數據允許個別不準確數據存在。21.監控不間斷地錄制視頻產生了大量的視頻數據,而有用的數據可能僅有十幾秒,這體現了大數據的( )特征。A.數據類型繁多 B.資源可共享 C.價值密度低 D.變化速度快22.下列關于大數據的說法,正確的有:( )A.當數據量很大時,可以抽取部分數據作為大數據的數據源B.對于大數據不再追求精確性,而是能夠接受數據的混雜性C.大數據產生的速度快,處理速度可以慢一些D.大數據讓我們的生活更便利,百利而無一害23.關于大數據和大數據處理,下列說法不正確的是( )A.大數據的特征是數據量大、速度快、數據類型多、價值密度低B.大數據分析的是抽樣數據,讓決策更精準C.處理大數據時一般采用分治思想D.道路交通中實時產生的數據屬于流數據24.在2022年冬奧會上,各大賽場賽場安裝了多個高清攝像機,實時記錄比賽情況,以確保公正制裁。攝像機記錄信息的過程屬于( )A.數據可視化表達 B.數據分類 C.數據分析 D.數據采集25.下列關于數據可視化的描述中不正確的是( )A.數據可視化增強了數據的解釋力與吸引力 B.數據可視化是將數據以圖形圖像等形式表示C.數據可視化可以直觀地呈現數據中蘊含的信息 D.標簽云是基于語句的文本內容可視化二、判斷題26.大數據的特點是數據量超大,起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。( )27.互聯網、智能終端等源源不斷產生海量數據,數據傳輸能力從TB、PB級攀升至EB、ZB級。這一變化主要體現了大數據體量巨大的特征。( )28.數據可視化表達工具只能處理靜態數據,無法處理動態變化的數據。( )29.數據可視化是指以圖形、圖像、地圖、動畫等生動、易于理解的方式展示數據和詮釋數據之間的關系、趨勢與規律等,以便更好地理解數據。( )30.高德地圖根據用戶實時上報的交通信息,通過大數據平臺整合各種信息,給出相應的路線。 ( )31.大數據其實就是大型數據庫系統。( )32.數據可視化是指以圖形、圖像和動畫等方式更加直觀生動地呈現數據及數據分析結果,揭示數據之間的關系、趨勢和規律等。( )33.大數據對我們的意義在于,我們有可能從如此龐大的數據中挖掘出有價值的數據,并運用于管理、農業、金融、醫療和教育等各個社會領域,為社會發展服務。 ( )34.微信支付、支付寶支付、滴滴打車等都包含著大數據在生活中的應用。( )35.數據分析的方法主要有對比分析、平均分析。對比分析是指將兩個或兩個以上的數據進行比較,分析它們的差異,來反映總體在一定時間、地點條件下某一數量特征的一般水平。 ( )三、操作題36.情景二:大數據時代在日常工作、生活和學習等活動中,人們的數字化活動都會產生數據,使用導航出行、撥打電話、發送微信、網上瀏覽查閱資料、線上購物…人類社會活動產生了海量的數據正確、高效地對這些數據進行采集、存儲、處理,并發掘數據中的價值,將對人類社會生活帶來更大的積極影響。圍繞以上情景,回答下題。(1)在大數據時代,網絡信息的采集是一項重要的工作,如果單純靠人力進行網絡信息采集,不僅低效繁瑣,搜集的成本也會提高。此時,我們可以合法使用( )對網絡數據進行自動采集。A系統日志 B.網絡爬蟲 C.傳感器 D.問卷調查(2)大數據存儲技術是大數據領域的另一個關鍵技術,人們利用( )代替集中式存儲,這種存儲方式能夠支持多臺處理器或多個計算機節點并行計算來提高解決問題的效率。A分布式存儲 B.本地存儲 C.移動存儲 D.磁帶存儲(3)某國的一家大型連鎖超市通過利用信息系統對大量的銷售數據進行了特定的分發現一個“奧秘”,于是這家超市就把尿布和啤酒這兩種看起來沒有關聯的商品擺放在一起銷售,結果銷售量大幅增加。原來,超市經營者從數據分析中發現,嬰兒尿布通常是男人們下班時購買的,而他們在購買尿布時又會順便購買自己愛喝的啤酒。這個案例中的超市信息系統應用了大數據分析中的哪種技術?( )A.聚類分析 B.關聯分析 C.分類分析 D.回歸分析(4)導航軟件提供了“未來出行”功能,用戶可以設定未來出行時間,軟件利用大數據分析,預估未來行程所需時長,為用戶合理規劃出行時間提供參考。這一功能凸顯了大數據分析的哪一個核心作用?( )A.了解事物的現狀 B.剖析事物的發展歷程C.預測事物的未來走向 D.數據價值化(5)如圖是一張火車票,上面有時間、目的地、身份證號碼等數據,則下列說法錯誤的是( )A.數據采集技術的迅速發展,數據的表現形式也越來越多樣化,給人們的生活帶來了巨大的改變B.只有云計算、物聯網、大數據等技術才能體現數據與生活C.在人們的日常生活中數據無處不在D.對于身份證號碼等涉及個人隱私的數據要注意保護試卷第1頁,共3頁試卷第1頁,共3頁參考答案:1.D【詳解】本題主要考查大數據的應用。大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法透過主流軟件工具,在合理時間內達到擷取、管理、處理、并整理成為幫助企業經營決策更積極目的的資訊。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。基于科技文獻數據庫檢索某一領域研究進展不符合大數據的定義,故本題選D選項。2.C【詳解】本題主要考查大數據的描述。大數據要分析的是全體數據,而不是抽樣數據;大數據采集系統需要采集大量的視頻、音頻、照片等非結構化數據,以及網頁、博客、日志等半結構化數據;大數據具有低價值密度性,所以大數據無需保證每個數據都準確無誤,故本題選C選項。3.C【詳解】本題主要考查大數據的描述。大數據是未來信息技術產業的一種原料,可以從中提取很多有效信息;在很多情況下,大數據的來源可以不依靠人工;大數據信息量很大,蘊藏的信息價值密度低;在大數據中,個別極端數據不會影響大數據分析結果,故本題選C選項。4.A【詳解】本題主要考查數據可視化。“詞云”就是通過形成“關鍵詞云層”或“關鍵詞渲染”,對網絡文本中出現頻率較高的“關鍵詞”的視覺上的突出。由圖可知,該圖譜采用的是詞云分布圖,故本題選A選項。5.B【詳解】本題主要考查詞云的描述。由圖可知,在整篇賀詞中,“我們”一詞是被提的最多的;詞云圖并未顯示了賀詞中出現的所有詞語;詞云圖可以通過文字大小、字體顏色來展現詞語出現的頻率;詞云圖是一種將文本進行可視化表達的方式,故本題選B選項。6.B【詳解】本題主要考查信息系統的描述。系統通過入口處刷臉獲得的特征值屬于信息的比對;零購物碼和出門二維碼使用后失效,體現了信息的時效性;系統自動對用戶數據進行加密是為了提高數據的安全性;大數據是一種大規模在獲取、存儲、管理、分析等方面超出了傳統數據庫軟件工具能力范圍的數據集合,僅僅超市的用戶信息算不上大數據,故本題選B選項。7.C【詳解】本題主要考查大數據的描述。通過統計分析海量網民在網上行為數據,百度發布《百度熱搜·北京冬奧會大數據》,以此了解人們對北京冬奧會的關注熱度。說明大數據時代強調要分析的是全體數據,而不是抽樣數據,故本題選C選項。8.A【詳解】本題主要考查數據采集。結合選項可知采集上述數據最為高效的方法是填寫在線收集表,故本題選A選項。9.A【詳解】本題主要考查大數據的描述。大數據是指無法在可承受的時間范圍內用常規軟件工具進行高效捕捉、管理和處理的數據集合,是需要新處理模式才能具有更佳的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產;物聯網、云計算、手機、電腦都是數據的來源;互聯網生成的數據量正以爆發性的速度不斷增長;在科學實驗中,各種傳感器每時每刻的速度不斷增長,故本題選A選項。10.A【詳解】本題主要考查大數據的描述。大數據采集的數據有結構化、半結構化和非結構化的;大數據的分析是全部數據;用大數據進行數據處理時,無需保證每個數據都準確無誤;在大數據時代,數據的主要來源是互聯網,故本題選A選項。11.B【詳解】本題主要考查大數據的描述。統計專業主要通過利用概率論建立數學模型,收集所觀察系統的數據,進行量化分析、總結,做出推斷和預測,為相關決策提供依據和參考。統計專業與大數據最貼近,故本題選B選項。12.D【詳解】本題主要考查大數據分析。“抖音”APP會針對用戶喜好推送視頻。該推送功能是基于對大數據的分析,在進行大數據分析時需要收集、分析用戶在不同視頻上停留的時間;分析關鍵詞所屬的視頻類別;采集用戶搜索的關鍵詞。不需要統計用戶使用抖音的時間,故本題選D選項。13.D【詳解】本題考查的是信息采集工具。打印機、繪圖儀是輸出設備,掃描儀適合采集圖像類素材,話筒適合采集音頻素材,故本題應選D。14.B【詳解】本題主要考查大數據技術的應用。大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合。 大數據技術,是指從各種各樣類型的數據中,快速獲得有價值信息的能力。 適用于大數據的技術,包括大規模并行處理(MPP)數據庫,數據挖掘電網,分布式文件系統,分布式數據庫,云計算平臺,互聯網,和可擴展的存儲系統。超市用手持測溫儀測量進場人員體溫沒有用到大數據技術,故本題選B選項。15.A【詳解】本題主要考查大數據的特點。大數據的特點有:數據價值密度低、數據類型多樣、數據處理速度快、數據規模大,故本題選A選項。16.B【詳解】本題主要考查數據可視化表達。標簽云(詞云)用詞頻表現文本特征,將關鍵詞按照一定的順序和規律排列,并以文字大小的 形式代表詞語的重要性。政府年度工作報告中的關鍵詞、《全唐詩》常用的詞語、《紅樓夢》中人物出現的次數均可以用標簽云(詞云)來呈現,學生期末考試成績不適合用標簽云(詞云)來呈現,故本題選B選項。17.A【詳解】本題主要考查大數據的描述。大數據的特點是涉及的資料量規模巨大;大數據可以幫助傳統行業;大數據會帶來機器智能;大數據是一種思維方式,故本題選A選項。18.D【詳解】本題主要考查數據的描述。數據管理主要經歷了人工管理、文件管理、大數據管理三個階段;Base64算法、MD5算法、AES算法、RSA算法、SHA-1是常用的數據加密算法,CRC是差錯校驗碼;態數據在很長的一段時間內不會變化,一般不隨運行而變;文本數據處理過程主要包括分詞、特征提取、數據分析、結果呈現,故本題選D選項。19.C【詳解】本題主要考查數據采集。物聯感知、視頻監控、網絡平臺均是自動采集,文獻調研是人工獲取,故本題選C選項。20.C【詳解】本題主要考查大數據技術。相關機構實時采集各地相關數據,每天發布疫情數據,用到了大數據技術;大數據要分析的是全體數據;超市、商場、醫院等場所,使用手持設備測量入場人員體溫,沒有使用大數據技術; 疫情期間,部分群眾沒有去過中高風險地區,也沒有接觸過確診病例等,但健康碼變色了,說明大數據允許個別不準確數據存在,故本題選C選項。21.C【詳解】本題主要考查大數據的特征。數據規模大、數據規模類型多樣、數據處理速度快、數據價值密度低均是大數據的特征。監控不間斷地錄制視頻產生了大量的視頻數據,而有用的數據可能僅有十幾秒,這體現了大數據的價值密度低特征,故本題選C選項。。22.B【詳解】本題主要考查大數據的描述。大數據是對全部的數據進行處理分析;對于大數據不再追求精確性,而是能夠接受數據的混雜性;大數據特征之一是處理速度快;大數據是一把雙刃劍,并非百利而無一害,故本題選B選項。23.B【詳解】本題主要考查大數據和大數據處理。大數據的特征是數據量大、速度快、數據類型多、價值密度低;大數據分析的是全部數據;處理大數據時一般采用分治思想;道路交通中實時產生的數據屬于流數據,故本題選B選項。24.D【詳解】本題主要考查數據采集。各大賽場賽場安裝了多個高清攝像機,實時記錄比賽情況,以確保公正制裁。攝像機記錄信息的過程屬于數據采集,故本題選D選項。25.D【詳解】本題主要考查數據可視化的描述。數據可視化增強了數據的解釋力與吸引力; 數據可視化是將數據以圖形圖像等形式表示; 數據可視化可以直觀地呈現數據中蘊含的信息; 標簽云是對關鍵詞的可視化,故本題選D選項。26.對【詳解】本題考查的是大數據相關知識。大數據或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。起始計量單位至少是P(1000個T)、E(100萬個T)或Z(10億個T)。題干中的說法是正確的。27.正確【詳解】本題主要考查大數據的特征。互聯網、智能終端等源源不斷產生海量數據,數據傳輸能力從TB、PB級攀升至EB、ZB級。這一變化主要體現了大數據體量巨大的特征,表述正確。28.錯誤【詳解】本題主要考查數據可視化的表達。數據可視化表達工具可以處理靜態數據,也能處理動態變化的數據,故表述錯誤。29.正確【詳解】本題考查的是數據的可視化表達。30.對【詳解】本題主要考查大數據的應用。高德地圖根據用戶實時上報的交通信息,通過大數據平臺整合各種信息,給出相應的路線,這正是大數據的優勢。因此本題說法正確。31.錯誤【詳解】本題主要考查大數據的描述。大數據和數據庫系統是兩個概念,大數據平臺主要以分布式存儲和分布式計算兩大基礎技術來展開,其中分布式存儲就涉及到數據庫系統,故表述錯誤。32.正確【詳解】本題考查的是數據可視化。數據可視化是指以圖形、圖像和動畫等方式更加直觀生動地呈現數據及數據分析結果,揭示數據之間的關系、趨勢和規律等。題干的說法是正確的。33.對【詳解】本題考查的是大數據。大數據指的是需要新處理模式才能具有更強的決策力、洞察力和流程優化能力的海量、高增長率和多樣化的信息資產。大數據對我們的意義在于,我們有可能從如此龐大的數據中挖掘出有價值的數據,并運用于管理、農業、金融、醫療和教育等各個社會領域,為社會發展服務。題干中的說法正確。34.正確【詳解】本題考查的是大數據在生活中的應用。微信支付、支付寶支付、滴滴打車等都包含著大數據在生活中的應用。題干描述正確。35.錯【詳解】本題考查數據分析。對比分析法的定義 對比分析法是指將兩個或兩個以上的數據進行比較,分析它們的差異,從而揭示這些數據所代表的事物發展變化情況和規律性。映總體在一定時間、地點條件下某一數量特征的一般水平是平均分析,題干概念混亂,說法錯誤。36. B A B D B【詳解】本題考查的是大數據相關知識。(1)網絡爬蟲是一種按照一定的規則,自動的抓取萬維網信息的程序或者腳本。故本題應選B。(2)分布式存儲是一種數據存儲技術,通過網絡使用企業中的每臺機器上的磁盤空間,并將這些分散的存儲資源構成一個虛擬的存儲設備,數據分散的存儲在企業的各個角落。故本題應選A。(3)關聯分析:分析發現存在于大量數據之間的關聯性和相關性,從而描述一個事物的共同規律和模式。故本題應選B。(4)利用大數據分析,預估未來行程所需時長,為用戶合理規劃出行時間提供參考,這一功能凸顯了大數據分析數據價值化的作用。故本題應選D。(5)在人們的日常生活中數據無處不在,不僅僅在云計算、物聯網、大數據等技術體現數據與生活。故本題應選B。答案第1頁,共2頁答案第1頁,共2頁 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫