資源簡介 (共82張PPT)必修一數(shù)據與計算復習2024第一章 數(shù)據與信息 》》數(shù)據、信息、知識、智慧1、數(shù)據是什么(無意義)2、編碼是什么(為什么要編碼 編碼種類有哪些 怎么編碼的)3、文件是什么(文件和數(shù)據有什么關系 你會找文件名嗎? 結構化、半結構化、非結構化)3、大數(shù)據是什么(1T? 特征4V 怎么用 )判斷題1、計算機中的數(shù)據都以ASCII碼存在?2、傳統(tǒng)數(shù)據庫技術一般用于非結構化數(shù)據管理?3、在個人計算機中,數(shù)據常以文件的形式存在4、計算機編碼是指對輸入到計算機中的各種數(shù)據用二進制數(shù)進行編碼的方式5、一個英文字符一個字節(jié) ,一個漢字兩個字節(jié)6、針對計算機病毒,需要堅持查殺為主,預防為輔的原則7、自然環(huán)境下的光線是數(shù)據結構化:通常以關系數(shù)據庫的形式存儲,如 Excel、Oracle、MySQL 等。半結構化:存儲:通常以 XML、JSON 等形式存儲。非結構化:通常以文件的形式存儲,如圖片、音頻、視頻等文件。非結構化:未經整理歸類的數(shù)據,數(shù)據的表現(xiàn)形式,文字、圖片……下列哪些屬于半結構化數(shù)據?(多選)A. 評論中的文本內容B. 郵件中的附件C. JSON 格式的數(shù)據D. HTML 頁面中的內容下列哪些屬于非結構化數(shù)據?(多選)A. 社交媒體上的帖子B. 掃描的文檔C. 圖片中的像素值D. 音頻文件中的內容下列哪些屬于結構化數(shù)據?(多選)A. 文本評論B. 圖像C. 數(shù)字D. 數(shù)據庫中的數(shù)據1、根據下圖說明數(shù)據、信息、知識與智慧的關系。1、根據下圖說明數(shù)據、信息、知識與智慧的關系。數(shù)據本身沒有明確的意義,將數(shù)據放在某個語境中,或在某個真實場景中使用,數(shù)據就有了意義,這就是信息。人們通過歸納、演繹、比較等手段對信息進行挖掘,形成知識。智慧是一種更高層次的綜合能力,表現(xiàn)為收集、加工、應用、傳播知識的能力,以及對事物發(fā)展的前瞻性看法。【2023學】1.下列關于數(shù)據和信息的說法,正確的是( )A.在數(shù)據處理過程中不會有新的信息產生B.信息的保存和傳播可以不依附于載體C.信息的價值因人而異,但信息不會有虛假D.計算機中的數(shù)據表現(xiàn)形式不同,但都以二進制方式存儲【2022學】支付寶中的( )是數(shù)據 P5①支付寶好友的聊天語音 ②付錢碼③支付寶頭像圖片 ④賬戶余額數(shù)字⑤每天的運動步數(shù)A.①②③B.④⑤C.③④⑤D.①②③④⑤6.圓的面積計算方法是( ),是經過研究、總結歸納出來的科學方法。A.信息B.知識C.數(shù)據D.信息技術P10 知識的定義模擬信號A數(shù)字信號D編碼文件大數(shù)據進制轉換采樣、量化、編碼采樣、量化、編碼4V、()1、為什么要編碼2、是什么[定義]3、編碼有哪些編 碼定義:是信息按照某種規(guī)則或格式,從 一種形式 轉換為另一種形式的過程。計算機中編碼:按一定規(guī)則將文本、圖形、圖像、聲音、視頻等數(shù)據編成可在計算機中處理的二進制數(shù)字。編 碼解 碼 是 什 么 ?解碼:解碼是編碼的逆過程。1、為什么要編碼2、是什么[定義]3、編碼有哪些編 碼字符編碼條形碼二維碼聲音編碼圖像編碼視頻編碼ascii碼字符編碼ascii碼課本P186漢字編碼數(shù)字字母標點、運算符?字符編碼流量》容量》一個ascii碼字符的容量怎么計算?( )不是將模擬音頻數(shù)字化需要經過的步驟A.采樣 B.量化 C.編碼 D.輸入P14 模擬信號數(shù)字化的過程 計算機存儲的最小單位計算機存儲的基本單位(B)1 0 0 0 1 0 0 0一位二進制數(shù)碼: 1bit(比特位)1Byte(字節(jié))= 8bit★ 未標明是b,B,默認是B1KB=1024B1B=8b1MB=1024KB1GB=1024MB1TB=1024GB1PB=1024TB1ZB=1024EB1EB=1024PBb↓B↓KB↓MB↓GB↓TB1.3.4 編碼——數(shù)據的存儲容量單位8位二進制能表示幾種信息?1000種信息需幾位二進制?字符編碼ascii碼漢字編碼數(shù)字字母標點、運算符范圍:0-1270,A,空格單位>127 (D) 7F(H)外碼交換碼機內碼字形碼存儲、操作、傳輸?shù)?br/>處理顯示屏輸出、打印輸出等輸出利用鍵盤等輸入字符輸入怎樣將漢字輸入計算機?在計算機內部怎樣處理漢字?在各計算機之間怎樣交換漢字信息 計算機怎樣實現(xiàn)漢字信息的輸出(顯示)?漢字編碼1 漢字輸入碼(外碼)漢字輸入漢字存儲漢字顯示漢字打印漢字傳輸123342 處理碼(內碼)3 字形碼4 區(qū)位碼(交換碼)中 國 C h i n a某字庫采用點陣方式描述漢字字形,點陣規(guī)模為16×16,每個點用1個二進制位表示,“0”表示白點,“1”表示黑點,逐行編碼。漢字“和”的字形如右圖所示,下列描述正確的是 ( )A、該漢字字形編碼需要16×16個字節(jié)B、該漢字字形第一行編碼需要2個字節(jié)C、該漢字字形編碼的第一個字節(jié)內容是OFHD、該漢字字形編碼的最后一個字節(jié)內容是FFHB一段未經壓縮的Wave格式立體聲音頻,時長為5分鐘,采樣頻率為44.1kHz,量化位數(shù)是8bit,已知上傳音頻后音頻進行了壓縮,壓縮比為8:1,則壓縮后的音頻存儲容量約為( )A 25.2MBB 25.2KBC 3.2MBD 126KB內碼觀察軟件示例:如用16進制顯示了“PC個人電腦”這幾個字的內碼:50 43 B8 F6 C8 CB B5 E7 C4 D4,問“個”字內碼是什么?50 43 B8 F6 C8 CB B5 E7 C4 D4PC個人電腦有幾個ASCII碼幾個漢字?字符編碼條形碼二維碼聲音編碼圖像編碼視頻編碼ASCII、Unicode漢字編碼我國普遍采用EAN13條形碼,由13位數(shù)字組成,前3位數(shù)字表示國家代碼,最后一位叫校驗碼是用某種特定的幾何圖形按一定規(guī)律在平面上(二維方向)分布的黑白相間的圖形記錄數(shù)據符號信息Wave格式音頻文件的存儲容量可以通過下面的公式進行計算存儲容量=采樣頻率(Hz)*量化位數(shù)(bit)*聲道數(shù)*時長(s)/8B數(shù)字圖像包括矢量圖形與位圖圖像,圖像存儲容量計算存儲容量=總像素數(shù)*顏色位深度/8BPAL制式的視頻每秒播放25幀,NTSC制式每秒播放30幀。常見的視頻編碼方式有MPEG1、MPEG2、MPEG4等信息編碼基本的共有128個,用1個字節(jié)中的低7位編碼。二進制范圍為00000000~01111111,即十六進制的00~7FASCII碼1KB=1024B 1MB=1024KB 1GB=1024MB1TB=1024GB 1PB=1024TB 1EB=1024PB1ZB=1024EB (1B=8bit)1、為什么要編碼2、是什么[定義]3、編碼有哪些編 碼進制轉換十進制二進制十六進制除2倒取余除16倒取余位權展開相加位權展開相加4位轉1位1位轉4位進制轉換15. 二進制數(shù)碼在不同的數(shù)位上, 對應不同的權值,有二進制數(shù)(11011),其中虛線框中紅色的"1"對應的權值為( )A. 20 B. 21 C. 22 D. 2311.十六進制數(shù)4B用二進制數(shù)來表示,下列選項中正確的是( )A.1001001 B. 1001011 C. 1010101 D. 1011011 12.以下四個數(shù)中,最大的數(shù)是 (注意:B表示二進制,D表示十進制,H表示十六進制) ( )A. 11101B B.10111B C.103H D.170D BCa=int(input(‘請您輸入十進制數(shù):’))m=’ ’while a>0: #除到0為止m=m+str(a%2) #a對2求余,添加到字符串m最后a=a//2 #被除數(shù)print(m[::-1]) #倒著輸出十進制轉換為二進制代碼還可以怎么修改?while a>0:m=str(a%2) +ma=a//2return convert_s[n]return Convert_toB(n//base,base)+convert_s[n%base]1、基礎語法2、是什么[定義]3、編碼有哪些python計算機解決問題一般步驟算法定義與特征定義:“算法”指的是計算機解決問題的步驟,是為了解決問題而需要讓計算機有序執(zhí)行的,無歧義的,有限步驟的集合。有窮性有0個或多個輸入可行性確定性有1個或多個輸出算法描述自然語言流程圖偽代碼程序設計語言①輸入a、b值②如果a>b,輸出a,否則輸出b輸入a、b值if a>b輸出aelse輸出ba=float(input("輸入a:"))b=float(input("輸入b:"))if a>b:print(a)else:print(b)1、變量名命名規(guī)則2、數(shù)據類型3、算術運算、關系運算、邏輯運算4、函數(shù)與模塊5、分支語句6、循環(huán)語句易錯點a1 1a _a max “ab”整型、實型、布爾型、字符串型 3/2 4**0.5運算順序 a=b 和 a==b 的區(qū)別 True 首字母大寫要有返回值、調用、參數(shù)個數(shù)a=[1,2,3,4,5]for i in range(len(a)): for i in a:單分支、雙分支、多分支 if elif else輸入一個整數(shù),如果該數(shù)既是3的倍數(shù)又是7的倍數(shù)則輸出ok。參考答案:n = int( input("請輸入整數(shù):") )if n % 3 == 0 and n % 7 == 0:print("ok")區(qū)間測速代碼,下面代碼輸入后,程序報錯t = input("請輸入用時(小時):")s = 25v = s / tif v <= 100: print("正常")else:print("平均車速:" + str(v))print("超速")float( input("請輸入用時(小時):") )作業(yè)本 3.4分支某體育館中的游泳池有水位調節(jié)和水溫控制的功能。(1)該游泳池水位用變量w表示,其值范圍是low<=w<=high,用變量state存儲水位的正常、偏低和偏高三種狀態(tài),其值分別為0,1,2.下列Python選項不正確的是()A if w>high:state=2elif wstate=1else:state=0B if wstate=1if w>high:state=2else:state=0C state=0if wstate=1else:state=2D if wstate=1else:if w>high:state=2else:state=0python綜合運用函數(shù)min( ) max( )math.sqrt( ) pow( )int( ) float( ) str( )input( ) print( )random.randint(a,b) chr( )random.random( ) ord( )IPO輸入處理輸出1、數(shù)據類型2、初始化順序、分支、循環(huán)函數(shù)(返回值)、倒著做題,邏輯推理s=”one day i’ll fly away, leave all this to yesterday ”a=””b=[]for i in range(len(s)): a=a+s[i] if s[i]==” ” or i== len(s)-1:#如果紅色部分,這題的最后一個單詞yesterday就容易遺漏 b.append(a) a=””print(b)程序運行后,len(b)的值是( )A 9 B 10 C 11 D 12個位十位百位g=a%10s=a//10%10b=a//100進制轉換r=n%2 n=n//2 倒著輸出r=n%16 n=n//16 倒著輸出r=n%10 n=n//10 倒著輸出求最大值代碼lst1=[91,93,88,89,92]max1=lst1[0]for item in lst1[1:]:if item>max1:max1=item?5【2310強基】1. 表格數(shù)據的整理與計算。2. 數(shù)據圖表呈現(xiàn)的方法與意義。3. 幾種不同類型大數(shù)據的處理架構及原理。4.利用pandas模塊處理數(shù)據。5.利用matplotlib模塊繪圖,實現(xiàn)數(shù)據可視化。6.文本數(shù)據處理。7.大數(shù)據的典型應用下圖是學生體質健康數(shù)據的部分原始數(shù)據,觀察該數(shù)據存在什么問題。缺失數(shù)據為空錯誤數(shù)據不準確重復重復的數(shù)據非標準數(shù)據單位格式不一致1.數(shù)據整理的目的是( )①檢測和修正錯漏的數(shù)據 ②整合數(shù)據資源③規(guī)整數(shù)據格式 ④提高數(shù)據質量 ⑤預測趨勢A.①②⑤ B.②④⑤C.①②③④ D.②③④⑤C二、Pandas模塊——創(chuàng)建DataFrame對象_從excel文件讀入二維數(shù)據表import pandas as pddf=pd.read_excel(‘abc.xlsx’)print(df)創(chuàng)建方法4:從excel文件讀入二維數(shù)據表,pd.read_excel()print(df[2:3])print(df[2:5])print('----------------------')print(df.head(2))print('----------------------')print(df.tail(3))print('----------------------')df.姓名df['姓名']df[ df['英語']>110 ]df[ df.英語>110 ]df.at[2,'姓名']班級 語文 數(shù)學 信息0 1班 210 235 801 2班 194 255 58班級 語文 數(shù)學 信息1班 210 235 802班 194 255 58df1df2as_index=True時,“as_index”就類似表示將組標簽(類似“主鍵”)作為索引;as_index=False時,索引為0,1,2,3…name 班級 語文 數(shù)學 信息0 學生甲 1班 100 110 451 學生乙 2班 89 120 302 學生丙 1班 110 125 353 學生丁 2班 105 135 28df1=df.sort_values('總分',ascending=True)ascendng=True:升序排序ascendng=False:降序排序count() 和 sum()區(qū)別計數(shù) 數(shù)字才可用indexcolumnsvalues4、獲取身高>163的5、獲取李四的性別6、獲取身高列indexcolumnsvalues1、獲取身高>163的2、獲取第2-3行3、按身高排序(降序)二、文本數(shù)據處理的一般過程非結構化數(shù)據非結構化數(shù)據分詞數(shù)據分析文本數(shù)據源特征提取結果呈現(xiàn)1.文本數(shù)據處理的主要步驟包括:①數(shù)據分析 ②特征提取 ③分詞 ④結果呈現(xiàn) ⑤文本數(shù)據獲取下列文本數(shù)據處理順序正確的是( )A.①⑤②③④ B.②⑤③①④C.⑤①③②④ D.⑤③②①④2. 下列關于中文分詞方法的描述中,屬于基于詞典的分詞方法的是( )A.在分析句子時與詞典中的詞語進行對比,詞典中出現(xiàn)的就劃分為詞B.依據上下文中相鄰字出現(xiàn)的頻率統(tǒng)計,同時出現(xiàn)的次數(shù)越高就越可能組成一個詞C.讓計算機模擬人的理解方式,根據大量的現(xiàn)有資料和規(guī)則進行學習,然后分詞D.依據詞語與詞語之間的空格進行分詞DA人工智能表現(xiàn)形式:1、人臉識別2、機器翻譯3、語音識別歷史發(fā)展:1、符號主義2、聯(lián)結主義(深度學習)3、行為主義應用:1、領域人工智能2、跨領域人工智能3、混合增強人工智能041AI的發(fā)展歷程:主要方法2邏輯推演符號主義聯(lián)結主義行為主義數(shù)學推理證明生物學、神經科學深度學習進化主義行為反饋試錯自調整海量數(shù)據為基1該系統(tǒng)的下列應用中,體現(xiàn)人工智能技術的是A.打開賽事通查看賽事資訊B.使用實時翻譯解決語言障礙C.在支付寶中搜索“智能亞運一站通”D.在系統(tǒng)中購票后自動生成二維碼電子票B2.下列關于人工智能的說法,不正確的是A.領域人工智能依賴于知識庫和推理引擎B.深度學習模擬人類大腦處理數(shù)據的機制,需要大量數(shù)據進行訓練C.強化學習不依賴人類提供的數(shù)據,如AlphaGo Zero是通過自我博弈進行能力提升D.人工智能客服與人類客服一起合作服務顧客是混合增強智能的應用C[202301]3.該系統(tǒng)的下列應用中,體現(xiàn)人工智能技術的是A.將現(xiàn)場錄制的教學視頻保存到服務器B.系統(tǒng)自動生成考勤報表C.學生進教室時通過攝像頭刷臉簽到D.教師將教學資源發(fā)送到學生的移動終端[202306]2.下列關于人工智能的說法,不正確的是A.深度學習方法一般脫離數(shù)據進行學習B.采用行為主義方法的智能體通過與環(huán)境的交互學習提升智能C.符號主義人工智能的實現(xiàn)依賴對符號的推理和運算D.人工智能促進社會發(fā)展的同時也會帶來一定的社會擔憂3.指紋考勤機(如下圖所示)是通過提取指紋圖像對人員的考勤進行管理,其工作流程可以分為:(1)指紋圖像處理(2)指紋圖像特征匹配(3)指紋圖像采集(4)指紋圖像特征提取,正確的順序應該是A.1234 B.3124 C.3142 D.3412C2.下列關于人工智能及其應用的說法,正確的是A.符號主義人工智能包含知識庫和推理引擎兩個部分B.聯(lián)結主義人工智能是一種在問題引導下的試錯學習C.行為主義人工智能通過模仿人類大腦中神經元之間的復雜交互來進行認知推理D. AlphaGo從圍棋人工智能跨界到電力控制領域,屬于混合增強智能【2】在人工智能的研究中,有如下推理過程:所有浙江省普通高中學生都可以選考技術(大前提);小明是浙江省普通高中學生(小前提);小明可以選考技術(結論)。采用上述方式研究并實現(xiàn)人工智能的方法稱為( )A.神經網絡 B.聯(lián)結主義 C.行為主義 D.符號主義D分——將問題分解為規(guī)模更小的子問題治——將規(guī)模更小的子問題逐個擊破合——將已解決的子問題合并,最終得出原問題的解大數(shù)據處理基本思想與架構分治算法①靜態(tài)數(shù)據:在處理時已收集完成、在計算時不會發(fā)生改變的數(shù)據,一般采用批處理方式。②流數(shù)據:不間斷地、持續(xù)地到達的實時數(shù)據,隨著時間的流逝,流數(shù)據的價值也隨之降低,通過實時分析計算可以得到更有價值的分析結果。③圖數(shù)據:現(xiàn)實世界中的許多數(shù)據,如社交網絡、道路交通等數(shù)據,可采用圖計算進行處理。積跬步,志千里2024 展開更多...... 收起↑ 資源預覽 縮略圖、資源來源于二一教育資源庫