版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、3*2*2 的輸出是多少? (1分)8 % 4的輸出是多少? (1分)32 + 32的輸出是什么? (1分)32 32的輸出是什么?(1分)Sheng Xin Bao Dian. find(x)和Sheng Xin BaoDian . find (X)的輸出分別是? (2分)一句話計(jì)算Sheng Xin Bao Dian字符串中n的數(shù)目? (1分)寫出下面10段程序的輸出?(1分/段)aList = 1, 2, 3 bList = aList bList. append(4) aListaList = 1, 2, 3 cList = aList: cList. append(4) aLista
2、List = 1, 1, 2, 2, 3, 5, 4, 3 aSet = set (aList) aSet1, 2, 3 * 2i*2 for i in 1,2,3diet ( (i, i*2) for i in range (5)import re re. findall (,z I imageGPz/, ).joinvL Sheng , Xin , Bao , Dian)def sumNumber (a, b):return a + b sumNumber(2, 3)def sumNumber (a, b):return a + b print(sumNumber(2, 3)3.程序運(yùn)行沒
3、有錯(cuò)誤不代表你寫的程序完成了你的需 求,你要去查驗(yàn)輸出結(jié)果是不是你想要的。2 5.關(guān)于程序調(diào)試0.在初寫程序時(shí),可能會(huì)出現(xiàn)各種各樣的錯(cuò)誤,常見的 有縮進(jìn)不一致,變量名字拼寫錯(cuò)誤,喪失冒號(hào),文件 名未加引號(hào)等,這時(shí)要根據(jù)錯(cuò)誤提示查看錯(cuò)誤類型是 什么,出錯(cuò)的是哪一行來定位錯(cuò)誤。當(dāng)然,有的時(shí)候 報(bào)錯(cuò)的行自身不一定有錯(cuò),可能是其前面或后面的行 出現(xiàn)了錯(cuò)誤。.用腦袋運(yùn)行程序:當(dāng)程序?qū)懽魍瓿珊螅约簢L試對(duì)著 數(shù)據(jù)文件,一行一行的執(zhí)行程序,來看程序的運(yùn)行是 否與自己想干的活一致,有沒有維漏。.當(dāng)結(jié)果不符合預(yù)期時(shí),要學(xué)會(huì)使用print來杳看每步 的操作是否正確,比方我讀入了字典,我就打印下字 典,看看讀入的是
4、不是我想要的,是否含有不該存在 的字符;或者在每個(gè)判斷句、函數(shù)調(diào)入的情況下打印 個(gè)字符,來跟蹤程序的運(yùn)行軌跡.寫程序以下面列表中每個(gè)元素為key ,元素出現(xiàn)的次數(shù)為value , 構(gòu)建一個(gè)字典,并遍歷字典按元素的ASCII碼順序輸出? (5分) aList = a, b, c, a, d/e; A.對(duì)教案中腦筋急轉(zhuǎn)彎問題的解法進(jìn)行優(yōu)化;問題是:現(xiàn)有100元 錢,需要買100個(gè)物品,其中鉛筆盒單價(jià)5元,筆單價(jià)3元,橡皮 單價(jià)0.5元,怎么組合可以把100元花完,同時(shí)三種物品的個(gè)數(shù)和 為100,請(qǐng)用編程解決。(3分).寫程序用高斯的計(jì)算方式計(jì)算1+2+3+.+100的加和。(3分).指出下面每個(gè)程
5、序運(yùn)行時(shí)可能會(huì)出現(xiàn)的錯(cuò)誤。(1分/段)aList = 1, 2,3 aDict = aDictaList = 1 b = aDictf a,if 1: print(z,Sheng xin bao dian great!”)32 + 32aList = 1, 2, 3 aList. add(4)aList = 1, 2, 3join(aList)int ( a)3/0for i in range(10) print (L)Sheng Xin * 3type 二 1. Python文件讀寫函數(shù)open的mode參數(shù)中r, w, a, t, b, x分別是什 么意思? (3分). Python中如何
6、獲取當(dāng)前所在的工作目錄?如何修改工作目錄? (3 分). Python中連接多個(gè)字符串的方法有哪些?優(yōu)缺點(diǎn)是什么? (3分). print (-% (1/3)的輸出是什么? (2 分).描述下語句import pandas as pd做了什么操作? (2分).教案中基因ENSEMBLE ID轉(zhuǎn)Gene Symbol程序用pandas實(shí)現(xiàn) (GRCh38. idmap,ensm. id)o (5 分). Jupyter中溉writefile, %run宏命令的用途是什么? (2分).找出 TP53 mRNA 序列中的 ORF (human_TP53_mRNA. fa)o (5 分).列出大腸桿菌
7、基因組中限制性內(nèi)切酶See!的切割位置(Ecoli. fa)0 (5 分).計(jì)算data/testl. fa中每條序列的GC含量。(5分).不使用pandas ,寫Python腳本處理Pandas教案中的TPM表 達(dá)矩陣的提取和合并?(ENCFF060LPA.tsv, ENCFF262OBL.tsv, ENCFF289HGQ.tsv, ENCFF673KYR.tsv) (8 分).給定FASTA格式的文件(testl.fa和test2.fa),寫一個(gè)程序cat. py讀入文件,并輸出到屏幕(2分)open(file)for. in loopprint()strip() function用到的知
8、識(shí)點(diǎn)13.給定FASTQ格式的文件(testl.fq),寫一個(gè)程序cat. py讀入文件,并輸出到屏幕(2分)0.同上.用到的知識(shí)點(diǎn)14.寫程序splitName.py,讀入test2.fa,并取原始序列名字第一個(gè)空 格前的名字為處理后的序列名字,輸出到屏幕(2分)0. split.字符串的索引.用到的知識(shí)點(diǎn).輸出格式為:NM_001011874gcggcggcgggcgagcgggcgctggagtaggagctg.15.寫程序formatFasta. py,讀入test2.fa ,把每條FASTA序列連成 一行然后輸出(2分)0. join. strip.用到的知識(shí)點(diǎn).輸出格式為:NM_0
9、01011874gcggcggcgggcTCCGCTGGCGTTCACC.CGGGGTCCGGAG16 .寫程序 formatFasta-2. py, 讀入test2.fa,把每條FASTA序列分 割成80個(gè)字母一行的序列(2分)0.字符串切片操作. range.用到的知識(shí)點(diǎn).輸出格式為 NM_001011874 gcggcggcgc.(60 字母).TCCGCTGACG #(每行80個(gè)字母) acgtgctacg.(60 個(gè)字母).GCGTTCACCCACGTACGATG (最后一行可缺乏80個(gè)字母)17.寫程序sortFasta. py,讀入test2.fa,并取原始序列名字第一個(gè)空 格前
10、的名字為處理后的序列名字,排序后輸出(2分)0. sortdietaDictkey=aDictkey.append(value)用到的知識(shí)點(diǎn).提取給定名字的序列(2分)0.用到的知識(shí)點(diǎn). print fh, or fh.write().取模運(yùn)算,4%2=0.寫程序grepFasta. py,提取中名字對(duì)應(yīng)的test2.fa的序列,并輸出到屏幕。.寫程序grepFastq. pyz提取中名字對(duì)應(yīng) 的testl.fq的序列,并輸出到文件。.寫程序 screenResult. py, 篩選 test.expr 中 foldChange 大于 2 的基因并且pa
11、dj小于0.05的基,可以輸出整行或只輸出基因名 字。(4分)0.邏輯與操作符and.文件中讀取的內(nèi)容都為字符串,需要用int轉(zhuǎn)換為整 數(shù),float轉(zhuǎn)換為浮點(diǎn)數(shù).用到的知識(shí)點(diǎn)20.寫程序 transferMultipleColumToMatrix. py 將文件 (multipleColExpr.txt)中基因在多個(gè)組織中的表達(dá)數(shù)據(jù)轉(zhuǎn)換為矩陣 形式,并繪制熱圖。(6分)0. aDict key = . aDictkey key2 = value. if key not in aDict. aDict = ,ENSG00000000003, : ,A-431Z/:21.3, A-549” ,E
12、NSG00000000003M :,.用到的知識(shí)點(diǎn).輸入格式(只需要前3列就可以)Gene Sample ValueUnit Abundance ENSG00000000003 A-431 21.3FPKM Medium ENSG00000000003 A-549 32.5FPKM Medium ENSG00000000003 AN3-CA 38.2FPKM Medium ENSG00000000003 BE WO 31.4FPKM Medium ENSGOOOOOOOOOO3 CACO-2 63.9FPKM High ENSGOOOOOOOOOO5 A-431 0.0 FPKMNot det
13、ected ENSG00000000005 A-549 0.0FPKM Not detected ENSG00000000005 AN3-CA0.0 FPKM Not detected ENSG00000000005BEWO 0.0 FPKM Not detectedENSG00000000005 CACO-2 0.0 FPKM Not detected.輸出格式 Name A-431 A-549 AN3-CA BEWOCACO-2 ENSG00000000460 25.2 14.2 10.6 24.414.2 ENSG00000000938 0.0 0.0 0.0 0.0 0.0ENSG00
14、000001084 19.1 155.1 24.4 12.6 23.5ENSG00000000457 2.8 3.4 3.8 5.8 2.921.寫程序 reverseComplementary. py 計(jì)算序列 ACGTACGTACGTCACGTCAGCTAGAC 的反向互補(bǔ)序列。(2 分)0. reverse. list(seq).用到的知識(shí)點(diǎn)22.寫程序 collapsemiRNAreads. py 轉(zhuǎn)換 smRNA-Seq 的測(cè)序數(shù)據(jù)。(5分)0.輸入文件格式(mir.collapse, tab-分割的兩列文件,第 一列為序列,第二列為序列被測(cè)到的次數(shù))ID_REFVALUE ACTG
15、CCCTAAGTGCTCCTTCTGGC 2 ATAAGGTGCATCTAGTGCAGATA 25 TGAGGTAGTAGTTTGTGCTGTTT 100 TCCTACGAGTTGCATGGATTC 41.輸出文件格式(mir.collapse.fa,名字的前3個(gè)字母為 樣品的特異標(biāo)示,中間的數(shù)字表示第幾條序列,是序 列名字的唯一標(biāo)示,第三局部是x加每個(gè)reads被測(cè) 到的次數(shù)。三局部用下劃線連起來作為fasta序列的 名字。)ESB_l_x2ACTGCCCTAAGTGCTCCTTCTGGC ESB_2_x25 ATAAGGTGCATCTAGTGCAGATA ESB_3_xl00 TGAGGT
16、AGTAGTTTGTGCTGTTT ESB_4_x4 TCCTACGAGTTGCATGGATTC23.簡(jiǎn)化的短序列匹配程序(map.py)把short.fa中的序列比對(duì)到 ref.fa,輸出短序列匹配到ref.fa文件中哪些序列的哪些位置。(10 分)0. find.用到的知識(shí)點(diǎn).輸出格式(輸出格式為bed格式,第一列為匹配到的染色體,第二列和第三列為匹配到染色體序列的起始終止位置(位置標(biāo)記以0為起始,代表第一個(gè)位置;終止位置不包含在內(nèi),第一個(gè)例子中所示序列的位置 是(199,208(前閉后開,實(shí)際是chrl染色體第199- 206的序列,。起始).第4列為短序列自身的序列.)。.附加要求:可以只匹配到給定的模板鏈,也可以考慮 匹配到模板鏈的互補(bǔ)鏈。這時(shí)第5列可以為短序列的 名字,第六列為鏈的信息,匹配到模板鏈為+, 匹配到互補(bǔ)鏈為-注意匹配到互補(bǔ)鏈時(shí)起始位置24.備注:也是從模板鏈的5端算起的。chrl 199 208 TGGCGTTCA chrl 207
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024至2030年中國微型透視器數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024至2030年中國定型烘干小樣機(jī)行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024至2030年中國園區(qū)管理服務(wù)系統(tǒng)數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024年中國芳綸四氟混編盤根市場(chǎng)調(diào)查研究報(bào)告
- 2024年中國硝酸鈰銨市場(chǎng)調(diào)查研究報(bào)告
- 2024八年級(jí)數(shù)學(xué)上冊(cè)第四章圖形的平移與旋轉(zhuǎn)3中心對(duì)稱第2課時(shí)中心對(duì)稱圖形習(xí)題課件魯教版五四制
- 2024年新疆2024年客運(yùn)從業(yè)資格證模擬考試
- 2024年合作c1客運(yùn)資格證模擬考試題下載
- 校園欺凌處理制度及措施
- 趙作海與杜培武案件
- 流體力學(xué)筆記整理
- 音樂風(fēng)格分類數(shù)學(xué)建模
- 現(xiàn)代簡(jiǎn)約風(fēng)格發(fā)展趨勢(shì)
- 路緣石滑模施工工法
- 二年級(jí)上冊(cè)數(shù)學(xué)練習(xí)題集及作業(yè)設(shè)計(jì)意圖
- 設(shè)備稼動(dòng)率如何計(jì)算
- 三方共管賬戶資金監(jiān)管協(xié)議書
- 物權(quán)法知識(shí)點(diǎn)
- 定期清洗消毒空調(diào)及通風(fēng)設(shè)施的制度
- 強(qiáng)直性脊柱炎的護(hù)理PPT
- 濕、熱敷法操作規(guī)程及評(píng)分標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論