資源簡介 (共21張PPT)5.1認識大數據高中信息技術必修1新知導入本節主要內容:1、大數據的概念2、大數據的特征3、傳統數據與大數據的區別4、大數據對日常生活的影響新知導入典型的大數據案列超市預知高中生顧客懷孕明尼蘇達州一家塔吉特門店被客戶投訴,一位中年男子指控塔吉特將嬰兒產品優惠券寄給他的女兒——一個高中生。但沒多久他卻來電道歉,因為女兒經他逼問后坦承自己真的懷孕了。塔吉特百貨就是靠著分析用戶所有的購物數據,然后通過相關關系分析得出事情的真實狀況。新知講解大數據的基本概念:指無法在可承受的時間范圍內用常規軟件工具進行高效捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。新知講解數據(data):是事實或觀察的結果,是對客觀事物的邏輯歸納,是用于表示客觀事物的未經加工的原始素材。數據是指對客觀事件進行記錄并可以鑒別的符號,是對客觀事物的性質、狀態以及相互關系等進行記載的物理符號或這些物理符號的組合。它是可識別的、抽象的符號。新知講解數據不僅指狹義上的數字,還可以是具有一定意義的文字、字母、數字符號的組合、圖形、圖像、視頻、音頻等,也是客觀事物的屬性、數量、位置及其相互關系的抽象表示。例如,“0、1、2…”、“陰、雨、下降、氣溫”、“學生的檔案記錄、貨物的運輸情況”等都是數據。數據經過加工后就成為信息。計算機系統中,數據以二進制信息單元0、1的形式表示。新知講解數據的承載方式:物聯網、云計算、移動互聯網、車聯網、手機、電腦以及各種各樣的傳感器。數據的作用:人們提取信息、做出決策的重要依據,是推動信息社會發展的重要資源。溫故知新信息與數據的關系(1)數據是信息的表現形式和載體,可以是符號、文字、數字、語音、圖像、視頻等。而信息是數據的內涵,信息是加載于數據之上,對數據作具有含義的解釋。(2)數據是符號,是物理性的,信息是對數據進行加工處理之后所得到的并對決策產生影響的數據,是邏輯性和觀念性的(3)數據是信息的表現形式,信息是數據有意義的表示(4)數據是信息的表達、載體,信息是數據的內涵,是形與質的關系。(5)數據本身沒有意義,數據只有對實體行為產生影響時才成為信息。溫故知新大數據的特征不同的維度特征具體表現互聯網產生大數據大量(Volume)數據體量巨大,從TB級別躍升到PB級別。多樣(Variety)數據類型繁多,如網絡日志、視頻、圖片、地理位置信息等。低價值密度(Value)價值密度低,以視頻為例,在連續不間斷的監控過程中,有用的數據可能僅僅一兩秒。高速(Velocity)變化速度快,數據來自世界各地的網絡終端,且以秒為單位快速變化。互聯網思維樣本漸趨于總體數據要全量而不是抽樣,即強調數據規模全量,而不是強調數量巨大。精確讓位于模糊大數據時代追求的不是精確性,而是模糊性,適當忽略微觀層面上的精確度,在宏觀層面擁有更好的洞察力。相關性重于因果大數據時代應該尋找事物之間的相關關系,無須再緊盯事物之間的因果關系。大數據存儲與計算分布式存儲大數據存儲在互聯網不同的服務器與各客戶終端。分布式并行計算應用分布式并行計算處理互聯網的大數據。溫故知新大數據的與傳統數據的區別傳統數據大數據依賴模型以及算法數據本身保證了數據分析結果的有效性強調數據之間的因果關系當數據足夠多的時候,不需要了解具體的因果關系就能夠得出結論數據都需要前期進行結構化處理,并記錄在相應的數據庫中數據的結構的要求大大降低,各種維度的信息勾勒出每一個個體的各種特征。傳統數據挖掘方式,采集方法,內容分類,采信標準等都已存在既有規則,方法論完整大數據挖掘為新鮮事物,還沒有形成清晰的方法、路徑、以及評判標準。傳統數據詮釋宏觀、整體的狀況,用于影響政策決策大數據可以分析微觀、個體的狀況,用于調整行為與實現個性化。傳統數據來源于階段性的,針對性的評估,其采樣過程可能有系統誤差大數據來源于過程性的,即時性的行為與現象記錄,第三方、技術型的觀察采樣的方式誤差較小傳統數據分析所需要的人才、專業技能以及設施設備都較為普通,易獲得大數據挖掘需要的人才,專業技能以及設施設備要求較高,并且從業者需要有創新意識與挖掘數據的靈感而不是按部就班者,這樣的人才十分稀缺新知講解大數據的具體應用(1)洛杉磯警察局和加利福尼亞大學合作利用大數據預測犯罪的發生。(2)Google流感趨勢(GoogleFluTrends)利用搜索關鍵詞預測禽流感的散布。(3)統計學家內特·西爾弗(NateSilver)利用大數據預測2012美國選舉結果。(4)麻省理工學院利用手機定位數據和交通數據建立城市規劃。(5)梅西百貨的實時定價機制。根據需求和庫存的情況,該公司基于SAS的系統對多達7300萬種貨品進行實時調價。新知講解全球零售業巨頭沃爾瑪在對消費者購物行為分析時發現,男性顧客在購買嬰兒尿片時,常常會順便搭配幾瓶啤酒來犒勞自己,于是嘗試推出了將啤酒和尿布擺在一起的促銷手段。沒想到這個舉措居然使尿布和啤酒的銷量都大幅增加了。新知講解大數據與喬布斯癌癥治療喬布斯是世界上第一個對自身所有DNA和腫瘤DNA進行排序的人。為此,他支付了高達幾十萬美元的費用。他得到的不是樣本,而是包括整個基因的數據文檔。醫生按照所有基因按需下藥,最終這種方式幫助喬布斯延長了好幾年的生命。奧巴馬大選連任成功2012年11月奧巴馬大選連任成功的勝利果實也被歸功于大數據,因為他的競選團隊進行了大規模與深入的數據挖掘。時代雜志更是斷言,依靠直覺與經驗進行決策的優勢急劇下降,在政治領域,大數據的時代已經到來;各色媒體、論壇、專家鋪天蓋地的宣傳讓人們對大數據時代的來臨興奮不已。新知講解大數據的價值體現(1)對大量消費者提供產品或服務的企業可以利用大數據進行精準營銷;(2)做小而美模式的中小微企業可以利用大數據做服務轉型;(3)面臨互聯網壓力之下必須轉型的傳統企業需要與時俱進充分利用大數據的價值。新知講解大數據對日常生活的影響正面影響方便支付。移動支付發展得特別快。應用場所:醫院、餐廳、菜市場、加油站等方便出行。網絡約車出行、智能導航行車避免堵車、無人駕駛、智能地圖方便尋路方便購物與產品推介。節省人們出行購物的時間,幫助企業有效判斷用戶的信息需求和消費需求,對客戶進行產品推介,方便人們選購產品。方便看病與診病。網絡預約掛號,減輕與節省患者排隊掛號看病的辛勞與時間;方便醫生提前分析患者的病史數據,以便更科學診病。負面影響個人信息泄露。手機、計算機、網絡、信用卡等都可能導致數據泄露的風險信息傷害與詐騙。網絡信息可能被不法分子竊取,并對我們及身邊的親人造成傷害。課堂練習通過結合大數據和高性能的分析對快遞企業有益的情況有哪些?(1)及時解析故障、問題和缺陷的根源,每年可能為企業節省資金。(2)為成千上萬的快遞車輛規劃實時交通路線,躲避擁堵。(3)分析所有庫存單位,以利潤最大化為目標來定價和清理庫存。(4)根據客戶的購買習慣,為其推送他可能感興趣的優惠信息。(5)從大量客戶中快速識別出金牌客戶。(6)使用點擊流分析和數據挖掘來規避欺詐行為新知講解大數據的未來趨勢(1)數據的資源化。指大數據成為企業和社會關注的重要戰略資源,企業必須要提前制定大數據營銷戰略計劃,搶占市場先機。(2)與云計算的深度結合。大數據離不開云處理,云處理為大數據提供了彈性可拓展的基礎設備,是產生大數據的平臺之一。(3)科學理論的突破。大數據很有可能是新一輪的技術革命,隨之興起的數據挖掘、機器學習和人工智能等相關技術,可能會改變數據世界里的很多算法和基礎理論,實現科學技術上的突破。新知講解大數據的未來趨勢(4)數據科學和數據聯盟的成立。各大高校將設立專門的數據科學類專業,也會催生一批與之相關的新的就業崗位。(5)數據泄露泛濫。企業需要從新的角度來確保自身以及客戶數據,所有數據在創建之初便需要獲得安全保障。(6)數據管理成為核心競爭力。數據管理成為核心競爭力,直接影響財務表現。將數據管理作為企業核心競爭力,持續發展,戰略性規劃與運用數據資產,成為企業數據管理的核心。新知講解大數據的未來趨勢(7)數據質量是BI(商業智能)成功的關鍵。采用自助式商業智能工具進行大數據處理的企業將會脫穎而出。(8)數據生態系統復合化程度加強。大數據的世界不只是一個單一的、巨大的計算機網絡,而是一個由大量活動構件與多元參與者元素所構成的生態系統,終端設備提供商、基礎設施提供商、網絡服務提供商、網絡接入服務提供商、數據服務使能者、數據服務提供商、觸點服務、數據服務零售商等等一系列的參與者共同構建的生態系統。謝謝21世紀教育網(www.21cnjy.com)中小學教育資源網站有大把高質量資料?一線教師?一線教研員?歡迎加入21世紀教育網教師合作團隊!!月薪過萬不是夢!!詳情請看:https://www.21cnjy.com/help/help_extract.php中小學教育資源及組卷應用平臺5.1認識大數據一、選擇題1、從互聯網產生大數據的角度來看,大數據具有的特征是()A、“4V”特征:大量(Volume)、多樣(Variety)、低價值密度(Value)、高速(Velocity)B、樣本漸趨于總體,精確讓位于模糊,相關性重于因果C、分布式存儲,分布式并行計算D、沒有特征2、下列關于大數據的特征,說法正確的是()。A、數據價值密度高B、數據類型少C、數據基本無變化D、數據體量巨大3、大數據的最顯著特征是(?)。?A、數據規模大??B、數據類型多樣C、數據處理速度快??D、數據價值密度高4、當前社會中,最為突出的大數據環境是(?)。?A、互聯網??B、物聯網??C、綜合國力??D、自然資源5、大數據在我們的生活中,無處不在,下列說法正確的是()A、大數據帶給我們的全部都是正面的影響。B、大數據給我們的生活帶來便捷的同時也會產生負面影響。C、大數據可能會帶來個人信息泄露,我們應該全盤否定D、大數據只會給我們帶來信息傷害與詐騙。6、下列論據中,能夠支撐“大數據無所不能”的觀點的是(?)。A、互聯網金融打破了傳統的觀念和行為??B、大數據存在泡沫C、大數據具有非常高的成本??D、個人隱私泄露與信息安全擔憂7、當前大數據技術的基礎是由(?)首先提出的。A、微軟B、百度C、谷歌D、阿里巴巴8、下列國家的大數據發展行動中,集中體現“重視基礎、首都先行”的國家是(?)。?A、美國?B、日本?C、中國??D、韓國9、大數據時代,數據使用的關鍵是()。?A、數據收集?B、數據存儲?C、數據分析?D、數據再利用10、支撐大數據業務的基礎是(?)。A、數據科學?B、數據應用?C、數據硬件?D、數據人才二、判斷題1、當前,大數據產業發展的特點是規模較小并且增速緩慢。()2、傳統營銷模式比基于大數據的營銷模式針對性更強。(????)3、打通多源跨域數據屬于傳統數據密集型行業積極探索和布局大數據應用的表現。(????)4、大數據人才整體上需要具備數學與統計知識、?計算機相關知識、特定業務領域的知識等核心知識。(????)5、大數據的本質是洞察。(????)試題答案一、選擇題12345678910ADAABACDDB解析:1、大數據具有“4V”特征:大量(Volume)、多樣(Variety)、低價值密度(Value)、高速(Velocity)。2、同上題。3、大數據最顯著的特征是大量(Volume),也就是數據規模大。4、大數據的起源是互聯網,所以目前最為突出的大數據環境仍是互聯網。5、大數據給我們的生活帶來方便支付、方便出行、方便購物和方便就醫都正面的作用,同時也帶來了個人信息泄露、信息傷害與詐騙等負面影響。6、大數據的起源是互聯網。7、大數據技術的觀點首先由谷歌(Google)提出。8、韓國提出了“重視基礎、首都先行”。9、大數據時代,數據使用的關鍵是數據再利用。10、數據應用是支撐大數據業務的基礎。二、判斷題12345××√√解析:1、大數據產業發展的特點是規模較大、增速很快與多產業交叉融合。2、大數據成為企業和社會關注的重要戰略資源,企業必須要提前制定大數據營銷戰略計劃,搶占市場先機。3、數據生態系統復合化程度加強。大數據的世界不只是一個單一的、巨大的計算機網絡,而是一個由大量活動構件與多元參與者元素所構成的生態系統,終端設備提供商、基礎設施提供商、網絡服務提供商、網絡接入服務提供商、數據服務使能者、數據服務提供商、觸點服務、數據服務零售商等等一系列的參與者共同構建的生態系統。4、數據科學和數據聯盟的成立。各大高校將設立專門的數據科學類專業,也會催生一批與之相關的新的就業崗位。。5、大數據(bigdata)是指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。21世紀教育網www.21cnjy.com精品試卷·第2頁(共2頁)HYPERLINK"http://21世紀教育網(www.21cnjy.com)"21世紀教育網(www.21cnjy.com) 展開更多...... 收起↑ 資源列表 5.1認識大數據.doc 5.1認識大數據.pptx 縮略圖、資源來源于二一教育資源庫