版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
高中信息技術(shù)
必修一數(shù)據(jù)與計算
一、數(shù)據(jù)與信息
1.數(shù)據(jù)是對客觀事物的符號表示,在計算機科學中,數(shù)據(jù)是指所有能輸入到計算機并被計算機程
序處理的符號總稱,其表現(xiàn)形式可以是文字(數(shù)字)、圖形、圖像、音頻、視頻等。
2.信息的一般定義是數(shù)據(jù)所包含的意義。在信息論中,香農(nóng)給出的定義是用來消除隨機不確定的東西。
3.信息的特征:
(1)載體依附性:即信息必須依附于載體存在,不存在沒有載體的信息。
(2)時效性:信息(的內(nèi)容或價值)會隨著時間的推移發(fā)生變化。
(3)共享性:信息可以共享,且在傳播的過程中不發(fā)生損耗。
(4)可加工處理性、真?zhèn)涡裕盒畔⑹强梢赃M行加工的,加工后的信息具有真?zhèn)涡浴?/p>
(5)價值性:信息的價值包括顯性價值和隱形價值兩個方面,同時價值的高低具有相對性。
二、數(shù)字化
1.、數(shù)字化的定義:將模擬信號轉(zhuǎn)換為數(shù)字信號的過程稱為數(shù)字化。其中用到的主要設(shè)備是模數(shù)轉(zhuǎn)
換器(ADC)。
2.模擬量:模擬信號以連續(xù)變化的物理量存在,自然界中大多數(shù)信號都以模擬量形式存在。
3.數(shù)字量:數(shù)字信號在取值上是離散的、不連續(xù)的信號。
4.將模擬信號轉(zhuǎn)換成數(shù)字信號一般需要經(jīng)過采桂、量化與編碼三個步驟。
(1)采樣的參數(shù)是采樣頻率,單位是赫茲(Hz)。根據(jù)采樣定理:當采樣頻率大于或等于被采樣
信號最高頻率的兩倍時,得到的離散信號可以完整的保留原始信號的所有信息。
(2)量化指將信號的連續(xù)取值近似為宜限仝離散值的過程。量化主要參數(shù)是量化位數(shù),單位是
比特(bit);量化位數(shù)越多,劃分的越精細,量化結(jié)果與實際數(shù)據(jù)也越接近。
三、數(shù)制
四、編碼
UltraEdit軟件字符內(nèi)碼
ASCII碼
通常用來對拉丁字母進行編碼(半角符號)。該編碼使用1個字節(jié)中的低7位編碼,由128個代碼
組成(每個字節(jié)的開頭0~7,即00~7F)。1個ASCII碼字符儲存時占用1個字節(jié)的空間。
GB2312
通常用來對漢字進行編碼(全角符號)。1個GB2312編碼的字符存儲時占用2個字節(jié)的空間,每
個字節(jié)的開頭均為8~F。
注:(1)"10"的內(nèi)碼是3130o(2)小寫字母的編碼比對應的大寫字母大32D。如“A”的ASCII
碼為65,“a”的ASCII碼為97(均為十進制),十六進制相差20H。(3)i為69H,j為6AH。(4)
做題中關(guān)注點在字符的內(nèi)碼,內(nèi)碼的每個字節(jié)開頭是0~7,還是8~F。
五、圖形編碼
1.條形碼:常見的條形碼是由反差率相差很大的黑條和白條排成的平行圖案。我國普遍采用的條
形碼是EAN13條形碼
2.二維碼:用某種特定的幾何圖形按一定規(guī)律在平面上分布黑白相間的圖形記錄數(shù)據(jù)符號信息。
相對條形碼,二維碼存儲信息量更大。
3.對條形碼和二維碼的識別過程中雖然用到了攝像頭,但信息是直接從圖形編碼中獲取的,所以
不涉及數(shù)字化的過程。
六、多媒體編碼
1.圖像存儲容量:總像素X顏色位深度(位)(單位:bit)
總像素=寬像素X高像素(單位:個)
顏色位深度:用來表示每個像素顏色的二進制數(shù)的長度。如256種顏色的圖像,它的位深度為8位
(28=256)。RGB顏色模式圖像是24位。
數(shù)據(jù)存儲容量單位
(1)b:bit(比特),存放一位二進制數(shù),是最小的儲存容量單位。
(2)B:Byte(字節(jié)),8bit為IByte,為一個基本單位
(3)常用儲存單位間的關(guān)系:
1Byte(B)=8bit;1KB=1024B;1MB=1024KB;1GB=1024MB;1TB=1O24GB;1PB=1O24GB
2.音頻的容量:采樣頻率*量化位數(shù)*聲道數(shù)*時長(單位:bit)
3.視頻容量:幀圖像大小*總幀數(shù)(單位:bit)
七、數(shù)據(jù)保存與數(shù)據(jù)安全
1.計算機數(shù)據(jù)的管理已經(jīng)經(jīng)歷了人工管理、文件管理、數(shù)據(jù)庫管理三個階段。
2.結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)
(1)結(jié)構(gòu)化數(shù)據(jù):也成為行數(shù)據(jù),可以由二維表來進行邏輯表達和實現(xiàn)的數(shù)據(jù)
(2)非結(jié)構(gòu)化數(shù)據(jù):數(shù)據(jù)結(jié)構(gòu)不規(guī)范,不完整,無法用二維表來進行邏輯呈現(xiàn)。
(3)半結(jié)構(gòu)化數(shù)據(jù):介于結(jié)構(gòu)化和非結(jié)構(gòu)化之間,具有一定的結(jié)構(gòu)性
3.通過保護介質(zhì)實現(xiàn)數(shù)據(jù)安全的方法:磁盤陣列、數(shù)據(jù)備份、異地容災
4.通過加密數(shù)據(jù)實現(xiàn)數(shù)據(jù)安全的方法(保密性):凱撒加密、換位密碼、簡單異或
5.通過數(shù)據(jù)校驗保證數(shù)據(jù)完整的方法(完整性):MD5,CRC(奇偶校驗)、SHA1
八、數(shù)據(jù)處理
1.常見的數(shù)據(jù)問題及其處理方法:
(1)數(shù)據(jù)缺失:數(shù)據(jù)集中普遍存在的問題,一般可能是數(shù)據(jù)丟失或數(shù)據(jù)本身不完整
處理方法:忽略或采用平均值、中間值或概率統(tǒng)計值填充。
(2)數(shù)據(jù)重復:在多數(shù)據(jù)源合并時經(jīng)常出現(xiàn),導致資源冗余和浪費。
處理方法:進一步審核的基礎(chǔ)上進行合并或刪除。
(3)異常數(shù)據(jù):數(shù)據(jù)集中的某些數(shù)據(jù)不符合一般規(guī)律,例:健康系統(tǒng)顯示體溫到達50攝氏度。
處理方法:這些有可能是要去掉的噪聲,也有可能是含有重要信息的數(shù)據(jù)對象。
(4)邏輯錯誤:屬性與實際不符,違背業(yè)務規(guī)則或邏輯,例:某人的生日為13月4。日
處理方法:對應的字段需要設(shè)置取值范圍判斷。
(5)格式不一致:多出現(xiàn)在數(shù)據(jù)來源多樣的系統(tǒng)中
處理方法:將不同格式的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一格式后再進行處理。
2.常用的數(shù)據(jù)處理和統(tǒng)計分析工具有Excel、SPSS、SAS、MATLAB等軟件,也可以通過R>Python.
Java等計算機語言編程進行數(shù)據(jù)處理。
3.常見的圖表類型有:柱形圖、折線圖、餅圖、雷達圖、散點圖、氣泡圖等。
九、大數(shù)據(jù)
1.大數(shù)據(jù)的特征
(1)數(shù)據(jù)體量巨大(2)速度快:包括產(chǎn)生速度和處理速度。
(3)數(shù)據(jù)類型多(4)價值密度低
2.大數(shù)據(jù)思維
(1)分析全體數(shù)據(jù)而不是抽樣數(shù)據(jù)(2)不再追求精確性,而是能夠接受數(shù)據(jù)的混雜性
(3)不一定強調(diào)因果性而是更加注重相關(guān)性。
十、大數(shù)據(jù)處理
1.大數(shù)據(jù)處理的基本思想:“分治思想”,即將一個復雜的問題拆分成兩個或多個相同或相似的子
問題,找到求這幾個問題的解法之后,再找出合適的方法把它們組合成求整個問題的解法。
2.大數(shù)據(jù)處理的數(shù)據(jù)類型:
(1)靜態(tài)數(shù)據(jù):在處理時已經(jīng)收集完成、在計算時不會發(fā)生改變的數(shù)據(jù)
處理方法:批處理
(2)流數(shù)據(jù):不間斷地、持續(xù)地到達的實時數(shù)據(jù)。流數(shù)據(jù)的價值會隨著時間的流逝降低。
處理方法:流計算或?qū)崟r分析計算
(3)圖數(shù)據(jù):現(xiàn)實世界中以圖形式展現(xiàn)的數(shù)據(jù)。如社交網(wǎng)絡(luò)、道路交通等
處理方法:圖計算
3.批處理
Hadoop是一個可運行于大規(guī)模計算機集群上的分布式系統(tǒng)基礎(chǔ)架構(gòu),適用于靜態(tài)數(shù)據(jù)的批量
計算。Hadoop計算平臺主要包括Common公共庫、分布式文件系統(tǒng)HDFS、分布式數(shù)據(jù)庫HBase、
分布式并行計算模型MapReduce等多個模塊。
(1)分布式文件系統(tǒng)(HDFS):將大規(guī)模海量數(shù)據(jù)以文件的形式、用多個副本保存在不同的存儲
節(jié)點中,并用分布式系統(tǒng)管理。HDFS是一個高度容錯性的文件系統(tǒng),云盤、網(wǎng)盤的底層一般采用
HDFS實現(xiàn)。
(2)分布式數(shù)據(jù)庫(HBase):HBase建立在HDFS提供的底層存儲基礎(chǔ)上,采用基于列的存儲方
式,主要存儲非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),具有良好的橫向擴展能力。
(3)分布式并行計算模型(MapReduce):MapReduce是一種分布式并行編程模型,能夠進行大規(guī)模的
并行計算。其核心處理思想是將任務分解并分發(fā)到多個節(jié)點上進行并行處理,最后匯總輸出。
4.流計算
流計算主要用于處理流數(shù)據(jù),如大型購物網(wǎng)絡(luò)的廣告推薦、社交網(wǎng)絡(luò)的個性化推薦等。處理流
數(shù)據(jù)的軟件主要有TwitterStorm、Heron>Yahoo!S4等。Storm和S4是目前較為流行的開源分
布式實時計算系統(tǒng)。
5.圖計算
現(xiàn)實世界中的很多數(shù)據(jù)以圖的形式呈現(xiàn),或者是需要轉(zhuǎn)換為圖后才能分析。目前圖處理的軟件
主要分為兩類:圖數(shù)據(jù)庫和并行圖處理系統(tǒng)。
H■*一■、文本數(shù)據(jù)處理
1.文本數(shù)據(jù)處理主要應用在搜索引擎、情報分析、自動摘要、自動校對、論文查重、文本分類、
垃圾郵件過濾、機器翻譯、自動應答等方面。
2.典型的文本處理過程主要包括分詞、特征提取、數(shù)據(jù)分析、結(jié)果呈現(xiàn)等。
3.中文分詞方法
(1)基于詞典(字符匹配)的分詞方法:用詞典中的詞語進行比對。案例:Python中的jieba庫
(2)基于統(tǒng)計的分詞方法:根據(jù)上下文相鄰字出現(xiàn)的頻率統(tǒng)計。
(3)基于規(guī)則的分詞方法:根據(jù)現(xiàn)有資料和規(guī)律學習實現(xiàn)分詞。
4.特征提取方法
(1)根據(jù)專家知識挑選有價值的特征。(約等于人工分析)
(2)用數(shù)學建模的方法構(gòu)造評估函數(shù)自動選取特征。(目前大多采用)
5.結(jié)果呈現(xiàn)方式:
(1)標簽云:用文字大小形式表現(xiàn)詞語的重要性
(2)文本情感分析:根據(jù)分析的粒度不同,可以分為詞語級、語句級、整篇文章級三類。
十二、數(shù)據(jù)可視化
1.數(shù)據(jù)可視化是將數(shù)據(jù)以圖形、圖像等形式表示、直接呈現(xiàn)數(shù)據(jù)中蘊含信息的處理過程。
2.可視化的作用:快速觀察與追蹤數(shù)據(jù)、實時分析數(shù)據(jù)、增強數(shù)據(jù)的解釋力與吸引力等。
3.可視化的基本方法
(1)有關(guān)時間趨勢的可視化:展示隨時間的推移而變化的數(shù)據(jù),可采用柱形圖、折線圖等。
(2)有關(guān)比例的可視化:展示各部分的大小及其占總體比例關(guān)系的數(shù)據(jù),可以采用餅圖、環(huán)形圖
(也稱面包圈圖)等。
(3)有關(guān)關(guān)系的可視化:探究具有關(guān)聯(lián)性數(shù)據(jù)的分布關(guān)系,可以使用散點圖、氣泡圖等。
(4)有關(guān)差異的可視化:包含多種變量的對象與同類之間的差異和聯(lián)系,可以采用雷達圖。
(5)有關(guān)空間關(guān)系的可視化:地理數(shù)據(jù)或者基于地理數(shù)據(jù)的分析結(jié)果可以運用不同顏色或圖表直
接在地圖上進行展示。
十三、大數(shù)據(jù)的典型應用
1.大數(shù)據(jù)應用領(lǐng)域:隨著大數(shù)據(jù)在各行業(yè)的應用,數(shù)據(jù)成為核心資產(chǎn)。目前,大數(shù)據(jù)廣泛應用于
金融、交通、環(huán)境、醫(yī)療、能源、農(nóng)業(yè)等領(lǐng)域,極大地促進了各行業(yè)的發(fā)展。
2.大數(shù)據(jù)在電子商務方面的應用;精準營銷基于用戶購買行為挖掘用戶偏好;倉儲管理實現(xiàn)商品
自動補貨;供應鏈管理實現(xiàn)最優(yōu)配送路徑;智能網(wǎng)站分析用戶后向用戶智能推薦商品。
十四、人工智能
1.人工智能的概念:人工智能是指以機器(計算機)為載體,模仿、延伸和擴展人類智能、其與人
類或其他動物所呈現(xiàn)的生物智能有著重要區(qū)別。
2.人工智能的主要方法
(1)符號主義:認為學習或者其他的智能特征原則上均可以被型號精確地描述,從而被機器仿真。
符號主義方法包含知識庫和推理引擎兩個部分。它先將所有知識以邏輯形式表達,然后依靠推理引
擎,去驗證命題或謂語正確與否,或者學習推導出新規(guī)則、新知識。
案例:"鴕鳥會飛"、專家系統(tǒng)
(2)聯(lián)結(jié)主義:通過模仿人類大腦中神經(jīng)元之間的復雜交互來進行認知推理。多層神經(jīng)網(wǎng)絡(luò)(包
含輸入端、隱藏層和輸出端)是一種典型的深度學習模型。
(3)行為主義:認為智能體可以在與環(huán)境的交互中不斷學習,從而提升自己的智能水平。
案例:掃地機器人
3.人工智能的應用分類
(1)領(lǐng)域人工智能:依賴于領(lǐng)域知識和數(shù)據(jù)的人工智能。
(2)跨領(lǐng)域人工智能:智能系統(tǒng)從一個領(lǐng)域快速跨越到另一個領(lǐng)域。
(3)混合增強人工智能:多種智能體的混合形式,他將人的作用或人的認知模型引入人工智能系
統(tǒng),形成“混合增強智能”的形態(tài)。需要注意的是,在智能疊加協(xié)調(diào)的回路中,人類智能是智能回路
的總開關(guān)。
4.人工智能對社會的影響
(1)人工智能改善人類生活:智能家居、智慧城市、智能出行、智能購物等。
(2)人工智能促進經(jīng)濟發(fā)展:提供虛擬勞動力、提高生產(chǎn)力、加快實體經(jīng)濟轉(zhuǎn)型升級。
(3)人工智能帶來的社會擔憂:人工智能取代人類崗位,威脅人類安全。
十五、基礎(chǔ)算法
一、算法概念
1.廣義的講,“算法”指的是解決問題或完成任務的一系列步驟。在計算機科學領(lǐng)域內(nèi),“算法”
指的是計算機解決問題的步驟,是為了解決問題而需要讓計算機有序執(zhí)行的,無歧義的,有限步驟
的集合。
2.算法的特征:(1)有窮性:一個算法的處理步驟必須是有限的。
(2)可行性:每一步的操作與要求都是可行的,并且能夠在有限時間內(nèi)完成。
(3)確定性:每一步的執(zhí)行描述必須是明確的
(4)0個或多個輸入(5)1個或多個輸出
3.描述算法的方法:1自然語言描述;2流程圖描述;3偽代碼描述;4用程序設(shè)計語言描述。
4.編程解決問題的一般過程:1抽象與建模;2設(shè)計算法;3編寫程序;4調(diào)試運行程序。
二、流程圖基本圖形及功能
三、解析算法和枚舉算法
#雞兔同籠問題:今有雉兔同籠,上有三十五頭,下有九十四足,問雉兔各幾何?
1.解析算法:用數(shù)學公式或解題步驟計算結(jié)果
importmath
r=float(input("請輸入圓的半徑:"))
ifr>0:
s=math.pi*r**2
c=2*math.pi*r
print(,圓的面積為:',s)
print「圓的周長為:,,c)
else:
print("輸入的半徑無效!")
2,枚舉算法:按一定的順序一一列舉所有可能解
forchickeninrange(l>35):
rabbit=35chicken
if2*chicken+4*rabbit==94:
pr\Lnt('雞有',chicken,'只')
print('兔有',rabbit,'只’)
四、程序組成分析
1.注釋:在代碼中添加注釋,可以對代碼功能進行解釋說明。注釋在代碼運行過程中不參與執(zhí)行。
Python中有兩種注釋方式:1.用,#,開頭的單行注釋;2.用三引號開頭和結(jié)尾的多行注釋,這
種注釋本質(zhì)是創(chuàng)建了一個多行字符串。
2.變量和賦值:
程序中有些數(shù)據(jù)是未知或是可變的,為了零活的使用這些數(shù)據(jù),可以使用變量進行存儲。
示例第二行就創(chuàng)建了一個名為r的變量,用于存儲外部輸入圓的半徑。
(1)變量命名時需要遵循一些基本規(guī)則:
1變量名只能由字母(含漢字),數(shù)字和下劃線三種字符構(gòu)成;
2變量名不能以數(shù)字開頭;
3變量名區(qū)分大小寫;
4變量名不能和保留字相同;
這里特別需要指出兩點:
lPython變量名支持中文字符,但考慮兼容性一般不建議使用;
2Python共有35個保留字(見下圖),這些不可以被作為變量名使用。
(2)賦值語句:變量名=值;變量名=表達式;a,b=b,a
(3)賦值運算符:"="、"+="、"="、"*="、“/=”、”%=”等
3.數(shù)據(jù)類型:
Python共有四種基本數(shù)據(jù)類型:整型、實型(浮點型)、字符串型和布爾型
(1)整數(shù)類型(int):數(shù)學中的整數(shù)。例:10;
除此之外整數(shù)類型可以用多種進制表示,二進制前綴0b或0B(10=0bl010);八進制00或
00(10=0012);十六進制前綴0X或0X(10=0xA)
(2)浮點類型(float):數(shù)學中的實數(shù)。例10.0、1.0el
(3)字符串型(str):字符串可以用單引號、雙引號、三引號表示。
(4)布爾類型(Bool):只有True和False兩個值。
4.運算符和優(yōu)先級
運算符功能和作用示例優(yōu)先級
()小括號略0(最高)
**幕運算略1
*、/、//、%乘,除,整除,取余整除:不大于除法結(jié)果的最2
大整數(shù);取余:
x%y=xy(x//y)
+、加法、減法略3
<、>、<=、>=關(guān)系運算符結(jié)果為布爾類型4
==、!=關(guān)系運算符結(jié)果為布爾類型5
in、notin存在性判斷結(jié)果為布爾類型6
not非結(jié)果為布爾類型7
and與結(jié)果為布爾類型8
or或結(jié)果為布爾類型9
=賦值a,b二b,a10
5.表達式:變量、常量、運算符按一定規(guī)則組合構(gòu)成的式子
(1)表達式中存在多種運算符時,按優(yōu)先級運算,優(yōu)先級相同則從左到右
(2)Python中認為“0”(數(shù)值(空字符串)和False等價,非零數(shù)和非空字符串和True等價
(3)字符串比較時,比較的是兩者的ASCII碼值,從左到右逐位比較。例"123"<"23"=True
(4)數(shù)值類型的運算結(jié)果保留更精確的值。例1+2.0=3.0
6.常用內(nèi)建函數(shù)
(l)input([prompt]):獲取輸入,函數(shù)的參數(shù)為輸出提示字符,返回值為字符串類型
(2)int(objectbase]):將數(shù)值字符串轉(zhuǎn)為整型,base聲明進制類型,默認base=10=返
回值為十進制整藪類型。例int("FF”,16)=255
(3)float(object):轉(zhuǎn)為實型
(4)abs(x):返回x的絕對值
(5)len(seq):返回列表或字符串的長度,整數(shù)類型
(6)str(x):將x轉(zhuǎn)為字符串類型
(7)chr(x):x為ASCII碼值,返回x對應的字符(字符串型)
(8)ord(x):x為字符串,返回x對應的ACSII碼值,整數(shù)類型
(9)round(x[,n]):對x四舍五入,保留n位小數(shù)。round(6.78,l)=6.8
(10)max()Jmin():返回列表中的最大值和最小值
(ll)print():輸出內(nèi)容到控制臺。當參數(shù)只有一個,會自動將非字符類型轉(zhuǎn)為字符類型后輸出。
當參數(shù)有多個,可以用逗號連接后轉(zhuǎn)換為字符串輸出。例:print(10);print(10,“全”,10,“美”)
7.字符串類型(str)
(1)字符串一旦創(chuàng)建就無法更改(2)字符串的索引方式有正負兩種
(3)字符串切片:字符串名[start:stop:step],結(jié)果含頭不含尾,step可以為負。
(4)常用字符串操作方法
s.upper()#全部小寫轉(zhuǎn)大寫
s.lower()#全部大寫轉(zhuǎn)小寫
s.split(sep)#根據(jù)sep分割字符串s
s.find(y)#返回y第一次出現(xiàn)在s中的索引值,若未出現(xiàn)則為1
s.replace(oldnew[^max])#將old用new替換,max為最大替換次數(shù)。
s.count(sub)#統(tǒng)計sub在s中出現(xiàn)的次數(shù)
s.join(iter)#用s對iter做分隔符
注意:由于字符串是不可變對象,所以以上方法不會改變s的值,只是將改變后的結(jié)果進行返
回。
8.列表類型(list)
(1)列表類型為可變對象,列表中的每個元素數(shù)據(jù)類型可以相同也可以不同,甚至可以嵌套列表
類型;
(2)列表的訪問和切片和字符串基本相同;
(3)列表的常用操作方法:
s.append(x)#在列表的最后添加一個元素x
s.clear()#清空列表s中的所有元素
s.insert(i,x)#在s的第i位置增加元素x
s.pop(i)#將$第i位置的元素刪除
s.remove(x)#將列表中第一次出現(xiàn)的x字符刪除
s.sort(reverse)#對序列排序reverse=True(降序)/False(升序,默認)
s.reverse。#將$的內(nèi)容反轉(zhuǎn)
注意:以上方法會直接改變列表s的值。
9.字典類型(die)
例:d={"姓名":"小明","年齡":13,"性別":"男"}
(1)字典類型的特點是用花括號將各種元素放在一起,字典的每個元素都由兩部分組成:"鍵":"
值”,整個合起來叫“鍵值對”。
(2)字典的值只能通過“鍵”索引,因為字典內(nèi)部元素是無序排列的,沒有索引值的概念。
(3)字典添加值、修改值、刪除值:
修改:d["性別"]="女"
添加:d["國籍"]="中國"
刪除:deld["性別”]
(4)可以用d.key()或d.value()單獨輸出字典的鍵和值
10.多分支結(jié)構(gòu)
if(判斷條件〉:
語句塊1
elif(判斷條件》:
語句塊2
else:
語句塊3
(1)Python用代碼縮進表示代碼間的包含關(guān)系,同一級別代碼縮進相同
(2)當〈判斷條件>為True才執(zhí)行對應分支語句塊
(3)else并非必須,且當前面有條件(if)滿足后,后面的判斷(elif)會直接跳過,不執(zhí)行。
#例:
if10>5:
print(10)
elif20>10:
print(20)
#運行結(jié)果:10
.循環(huán)語句
for(循環(huán)變量〉in<循環(huán)對象〉:
語句塊
(l)for循環(huán)是有限次循環(huán),〈循環(huán)對象〉可以是字符串、列表,也可以是range。函數(shù)。
(2)range(start,stop,step)格式和字符串或列表切片類似。
while(判斷語句〉:
語句塊
(3)while的判斷語句不當,可能會造成“無限循環(huán)”。當〈判斷語句〉結(jié)果為True運行循環(huán),
為False退出循環(huán)。
(4)break:結(jié)束并退出當前層循環(huán)
(5)continue:結(jié)束本次循環(huán),進入下一次循環(huán)
12.自定義函數(shù)
def〈函數(shù)名)(〈參數(shù)1>,(參數(shù)2>...):
語句塊
[return[返回值]]
(1)函數(shù)命名規(guī)則同變量命名規(guī)則(2)函數(shù)參數(shù)可以設(shè)置默認值:〈參數(shù)3>=(默認值〉
(3)return語句用于返還函數(shù)處理結(jié)果,并且結(jié)束函數(shù)運行
(4)函數(shù)內(nèi)部變量為局部變量,當需要使用全局變量時需要用global聲明
13.第三方庫的使用
(l)import(庫名〉(2)import(庫名〉as〈別名)
(3)from〈庫名〉import(函數(shù)名〉(4)from〈庫名>import*
注:常用的math和random模塊函數(shù)見下頁圖表。
14.利用Pandas模塊處理數(shù)據(jù)
(1)常用的Python擴展模塊有numpy、scipy、pandas和matplotlib等,pandas模塊主要用于
數(shù)據(jù)的處理和分析。
(2)Python中引入pandas模塊的方法:importpandasaspd,pd是用戶為導入模塊取的別名。
(3)pandas提供了Series和DataFrame兩種數(shù)據(jù)結(jié)構(gòu)。
Series(系列):
①Series是一種一維的數(shù)據(jù)結(jié)構(gòu),包含一個數(shù)組的數(shù)據(jù)和一個與數(shù)據(jù)關(guān)聯(lián)的索引(index),索引
值默認是從。起遞增的整數(shù),數(shù)據(jù)可以是不同類型的元素。列表、字典等可以用來創(chuàng)建Series數(shù)
據(jù)結(jié)構(gòu)。
②Series對象屬性
屬性說明
indexSeries的下標索引,其值默認是從0起遞增的整數(shù),也可以指定為字符串型
values存放Series值的一個數(shù)組
DataFrame(數(shù)據(jù)框):
①DataFrame是一種二維的數(shù)據(jù)結(jié)構(gòu),由1個索引列(index)和若干個數(shù)據(jù)列組成,每個數(shù)據(jù)列可
以是不同的類型。DataFrame可以看作是共享同一個index的Series的集合。
創(chuàng)建DataFrame對象的方法很多,通常用一個相等長度的列表或字典來創(chuàng)建。
②DataFrame常用對象屬性
屬性說明
indexDataFrame的行索引
columns存放各列的標題
Values存放二維數(shù)據(jù)的值
T行列轉(zhuǎn)置
(4)pandas模塊中的Series對象
①創(chuàng)建Series
importpandasaspd
sl=pd.Series([l,2,3,4])
s2=pd.Series([l,2,3,4],index=[〃a","b〃,"c","d"])
②Series對象向檢索和修改
輸出索引值為。的值:print(sl[0])
輸出索引值為"b"的值:print(s2[〃b〃])
輸出values小于3的值:print(sl[sl<3])
修改索引值為1的值為1。:sl[l]=10
(5)pandas模塊中DataFrame對象
創(chuàng)建DataFrame對象:
使用一個相等長度的列表或字典創(chuàng)建DataFrame對象。
如x=pd.DataFrame({"xl":[1,2,3,4],"x2”:[5,6,7,8],"x3":[9,10,11,
12]))
導入二維數(shù)據(jù)文件創(chuàng)建DataFrame對象。
pd.read_excel(filename)#從Excel文件導入數(shù)據(jù)
pd.read_csv(filename)#從CSV文件導入數(shù)據(jù)
DataFrame對象導出到二維數(shù)據(jù)文件
df.to_excel(filename)#導出數(shù)據(jù)到Excel文件
df.to_csv(filename)#導出數(shù)據(jù)到CSV文件
②查看DataFrame對象:
通過index、columns、values屬性可以查看DataFrame對象的行索引、列索引及數(shù)據(jù),如:
df.index、df.columns、df.valueso
查看數(shù)據(jù)列:通過字典記法或?qū)傩詸z索DataFrame對象中的一列數(shù)據(jù),如:df['icT]或df.id。
查看數(shù)據(jù)行:通過head()、tail。返回DataFrame的前n行、后n行數(shù)據(jù);通過索引查看指定行,
如:df[2:5],返回df對象中第2、3、4行數(shù)據(jù);通過布爾型數(shù)據(jù)選取滿足條件的行。如:df[df["
age"]>=18]o
使用at□方法可以根據(jù)行標簽和列標簽選取單個值,如:df.at[0,"姓名"
③DataFrame對象中行、列的編輯
可以通過insert()、drop()、rename。、append。、set_value()等函數(shù)進行DataFrame對象
中行、列的編輯。^一
(6)DataFrame常用函數(shù)
tom1?注
count0ira(N?N)R?XIAO/IIR認為咄向drop()M*uh*0/l歐認為
灣組的ojfil
7as
tlMlO和敘20/1默認為Q曬append插入《聞》行)不2nl
mean()平均值
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度環(huán)保型鋼管扣件運輸與回收利用協(xié)議3篇
- 二零二五版電子元件采購合同數(shù)量取消及供應鏈調(diào)整補充協(xié)議3篇
- 2024建造師勞動合同
- 2025年度民族特色餐廳租賃及文化傳承合作協(xié)議3篇
- 二零二五年房地產(chǎn)糾紛調(diào)解估價委托合同模板3篇
- 2024年項目聯(lián)合開發(fā)協(xié)議3篇
- 二零二五年度高品質(zhì)建筑材料租賃與運輸管理合同3篇
- 二零二五版商用空調(diào)租賃與能源消耗優(yōu)化合同3篇
- 威海職業(yè)學院《突發(fā)公衛(wèi)事件應急處理》2023-2024學年第一學期期末試卷
- 天津城市職業(yè)學院《災害防御與避險應急》2023-2024學年第一學期期末試卷
- DB22T 5005-2018 注塑夾芯復合保溫砌塊自保溫墻體工程技術(shù)標準
- 醫(yī)院手術(shù)室醫(yī)院感染管理質(zhì)量督查評分表
- 心內(nèi)電生理導管及器械
- 稱量與天平培訓試題及答案
- 超全的超濾與納濾概述、基本理論和應用
- 2020年醫(yī)師定期考核試題與答案(公衛(wèi)專業(yè))
- 2022年中國育齡女性生殖健康研究報告
- 各種靜脈置管固定方法
- 消防報審驗收程序及表格
- 教育金規(guī)劃ppt課件
- 呼吸機波形分析及臨床應用
評論
0/150
提交評論