Indice generale Introduzione_第1頁(yè)
Indice generale Introduzione_第2頁(yè)
Indice generale Introduzione_第3頁(yè)
Indice generale Introduzione_第4頁(yè)
Indice generale Introduzione_第5頁(yè)
已閱讀5頁(yè),還剩65頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、universit degli studi di roma “l(fā)a sapienza” facolt di ingegneria corso di laurea in ingegneria informatica sistema informativo per la gestione delle pubblicazioni e delle citazioni candidatorelatore alfonsi paoloprof. marco schaerf anno accademico 2007/08 alla mia famiglia e a tutti gli amici che mi

2、 sono stati vicini in questi anni di studio. i must not fear. fear is the mind-killer. fear is the little-death that brings total obliteration. i will face my fear. i will permit it to pass over me and through me. and when it has gone past i will turn the inner eye to see its path. where the fear ha

3、s gone there will be nothing. only i will remain. frank herbert indice generale introduzione. 1 1 preliminari. 2 1.1 google scholar . 2 1.2 publish or perish . 4 1.3 cineca. 5 1.4 indici bibliometrici. 6 1.4.1 h-index di hirsch. 6 1.4.2 g-index di egghe. 7 1.4.3 h-index contemporaneo . 7 1.4.4 h-ind

4、ex individuale. 8 1.4.5 h-index individuale (variante). 8 1.4.6 awcr - tasso di citazioni pesato nel tempo. 9 1.5 formati bibliografici. 10 1.5.1 endnote. 10 1.5.2 bibtex . 11 1.5.3 ris refman. 12 1.5.4 csv . 13 1.5.5 mods. 14 1.6 cosa si vuole realizzare. 15 1.7 modello per il ciclo di vita del sof

5、tware.16 2 progetto. 17 2.1 studio di fattibilit. 17 2.1.1 problematiche riscontrate. 17 2.1.2 scelta degli strumenti. 18 2.2 raccolta e analisi dei requisiti.20 2.2.1 specifiche per il progetto. 21 2.3 progettazione della base di dati.21 2.3.1 specifiche. 21 2.3.2 progettazione concettuale. 22 2.3.

6、3 ristrutturazione dello schema e-r.24 analisi delle ridondanze . 24 eliminazione delle generalizzazioni . 25 scelta degli identificatori primari . 26 2.4 progettazione del software. 27 2.4.1 struttura del sistema . 28 db modules. 28 db modules inout . 29 2.4.

7、1.3 export import format. 29 gestione. 30 orm. 31 orm service . 31 2.4.2 architettura dei moduli. 31 scholar. 31 cineca. 34 endnote. 35 authors . 35 authorsservice . 36 statspanel . 36 2.4.3 strutture di memorizzazione e archivi

8、azione dati.37 3 descrizione delle funzionalit. 37 3.1 core. 38 3.1.1 menu debug. 38 3.1.2 menu importa files. 38 3.2 pannello scholar. 39 3.2.1 form per la ricerca. 40 3.2.2 visualizzazione dei risultati. 42 3.2.3 esportazione dei risultati . 43 3.2.4 selezione e deselezione dei risultati . 43 3.3

9、pannello cineca. 44 4 conclusioni e sviluppi futuri .46 appendice a. 48 a.1 java. 48 a.2 supporto java per la persistenza.49 a.2.1 java persistence api. 50 a.2.2 object-relational mapping. 51 a.3 gli ambienti di sviluppo. 52 a.3.1 netbeans. 52 a.3.2 eclipse . 52 appendice b . 54 sigle ed acronimi. 5

10、5 indice delle figure. 56 indice delle tabelle. 57 bibliografia. 58 sitografia. 60 introduzione lo scopo del lavoro di questa tesi quello di progettare e realizzare una architettura software per il controllo e la gestione dei dati riguardanti le pubblicazioni scientifiche. il sistema sviluppato vuol

11、e integrare la ricerca delle pubblicazioni tramite i motori di ricerca esistenti su internet, presenti e futuri, ed in particolare questa prima implementazione deve gestire linterfacciamento con google scholar. i dati ricavati da queste ricerche, salvati e integrati in una base di dati condivisa, so

12、no cos disponibili per permetterne elaborazioni e statistiche. lidea sorta dalla necessit di un ampliamento delle opportunit offerte da un software gi esistente, publish or perish, legato alla prospettiva di un codice open-source riutilizzabile per futuri sviluppi. 1 preliminari analizziamo qui di s

13、eguito i prodotti, software e concettuali, legati allo sviluppo di questa tesi: il software gi esistente publish or perish, le basi di dati online esistenti incontrate durante lo studio dei requisiti, gli indici bibliometrici indispensabili per lanalisi delle pubblicazioni e i formati strutturati in

14、 cui possibile riscontrare i dati delle pubblicazioni. 1.1 google scholar se ho visto pi lontano perch sono salito sulle spalle dei giganti che mi hanno preceduto. isaac newton google scholar nasce dalla cooperazione tra alex verstak e anurag achava, entrambi coautori del principale indice web di go

15、ogle. e un motore di ricerca, accessibile gratuitamente, che, tramite parole chiave, consente di individuare testi di letteratura accademica, ovvero tesi di laurea e di dottorato, libri, ricerche, sommari, recensioni, articoli sottoposti a revisione paritaria1 e rapporti riguardanti tutti i settori

16、della ricerca scientifica. google scholar raccoglie articoli da diverse case editrici specializzate e non nello studio e nella ricerca scientifica, in particolare indicizza gli articoli pubblicati dalla elselvier che considerato il pi grande editore scientifico. il motto ispiratore di google scholar

17、 “stand on the shoulders of 1 la revisione paritaria (peer review), una valutazione fatta da specialisti per selezionare articoli degni di pubblicazione. sottopone il lavoro o le idee di un autore allo scrutinio di uno o pi esperti del medesimo settore i quali forniscono una propria valutazione, inc

18、ludendo suggerimenti per il miglioramento, ad un redattore o ad un altro intermediario. giants” (“sali sulle spalle dei giganti”), riferendosi alla frase di newton che a sua volta risale al xii secolo quando giovanni di salisbury scrisse: bernardo di chartres diceva che noi siamo come nani che siedo

19、no sulle spalle di giganti, di modo che possiamo vedere pi cose e pi lontano di loro, non con lacutezza del nostro sguardo o con laltezza del corpo, ma perch siamo portati pi in alto e siamo sollevati ad altezza gigantesca. tramite questa frase, scholar vuole esprimere limportanza che ha il passato

20、e i progressi in esso fatti per proseguire il cammino della scienza ed arrivare a conclusioni pi lungimiranti e magari pi incisive, ma alle quali la ricerca non sarebbe arrivata se non tramite i vari passi svolti precedentemente da predecessori che vengono comunque considerati “giganti” per limporta

21、nza del lavoro svolto. google scholar, svolge una funzione simile ad altri motori di ricerca come scirus2 (motore interno di elsevier), a citeseer3, a scopus4 e a thomson isi web of science5. permette di ricercare per copie fisiche e/o digitali di articoli anche se questi appartengono a 2 scirus un

22、motore di ricerca specializzato per trovare (velocemente) informazioni scientifiche sul web. una risorsa pubblicata dalla elsevier. si tratta di uno dei pi vasti motori di ricerca specifici per argomenti scientifici. come fanno i normali motori di ricerca disponibili in internet, scirus indicizza mi

23、lioni di pagine web alla ricerca di contenuti scientifici. a differenza di quelli generici, per, scirus seleziona solo risorse di argomento scientifico. il motore ricerca in oltre 200 milioni di pagine web che pubblicano contenuti scientifici in generale: informazioni e documenti di carattere scolas

24、tico, tecnico e medico. in ambito medico, permette di trovare i report pi recenti, gli articoli peer-reviewed e le riviste che altri motori di ricerca non indicizzano. 3 citeseer un motore di ricerca e una biblioteca digitale di pubblico dominio per le ricerche accademiche scientifiche. fu creato da

25、 tre ricercatori di princeton allo scopo di catalogare e raccogliere documenti accademici e scientifici sul web, classificandoli in base allimpatto che avevano le citazioni. 4 scopus un database bibliografico che comprende anche estratti. citazioni e ricerche fornite da elsevier in cooperazione con

26、un numero di biblioteche di ricerca universitarie. indicizza una rassegna di circa 15800 riviste in campo scientifico, tecnico, medico e di scienze sociali. le ricerche in scopus incorporano anche ricerche scientifiche attraverso scirus. 5 thomson isi web of science un database bibliografico che ave

27、va legemonia nel settore scientifico prima dellarrivo di scopus e degli altri sopra-citati. biblioteche online e se larticolo disponibile liberamente sul web, questi collegamenti verranno mostrati. google scholar consente la ricerca allinterno di copie di articoli digitali o fisiche, basandosi su ca

28、ratteristiche chiavi di ricerca. attraverso la chiave “citato da”, scholar fornisce laccesso agli estratti degli articoli che da cui proviene la citazione; questa caratteristica che fornisce lindice delle citazioni; precedentemente si poteva trovare solo in scopus e in isi web of knowledge. usando p

29、oi la chiave “articoli correlati” viene fornita una lista di articoli con argomenti simili a quello cercato ordinati in base alla vicinanza con larticolo originale. alcuni ricercatori considerano google scholar come un database comparabile per qualit e utilit a database commerciali; tuttavia, stato

30、messo in rilievo un problema di segretezza, infatti, alcuni editori non gli permettono di entrare nelle loro riviste. le stesse riviste elsevier non erano incluse prima del 2007. google scholar rifiuta di pubblicare un elenco delle riviste scientifiche catalogate, e la frequenza dei suoi aggiornamen

31、ti ignota. perci impossibile sapere quante e quali ricerche correnti e/o esaurienti sono considerate. nondimeno, permette un facile accesso agli articoli pubblicati senza le difficolt riscontrate in alcuni dei pi famosi e costosi database commerciali. sebbene google scholar sia migliore rispetto ad

32、altri motori di ricerca esistenti, ha ancora difficolt nel “catturare” le informazioni relative alle pubblicazioni e alle citazioni in lingua non inglese, e per questo, elle scienze sociali e soprattutto in ambito umanistico, i suoi risultati sono ancora scarsi e poco attendibili rispetto alla conco

33、rrenza. 1.2 publish or perish il motto “publish or perish” si riferisce alla pressione che si ha di pubblicare nuovi lavori costantemente con lo scopo di promuovere e sostenere la propria carriera nel mondo accademico. il software publish or perish stato creato da anna-wil harzing; esso permette, in

34、terfacciandosi col motore di ricerca di google scholar, di poter analizzare le citazioni delle varie pubblicazioni e poterne estrapolare delle statistiche non solo per unanalisi del proprio lavoro accademico, come dice la creatrice del programma, ma soprattutto per vedere limpatto che la propria ric

35、erca ha nellambiente scientifico. i risultati possono essere analizzati a video e salvati in vari formati bibliografici. le statistiche che vengono fornite e che comprendono degli indici “bibliometrici” che analizzeremo nel prossimo paragrafo sono le seguenti: il numero totale delle pubblicazioni il

36、 numero totale delle citazioni numero medio di citazioni per paper numero medio di citazioni per autore numero medio di articoli per autore numero medio di citazioni per anno h-index di hirsch con relativi parametri g-index di egghe lh-index contemporaneo le citazioni pesate per la loro anzianit due

37、 variazioni degli h-index lanalisi del numero di autori per ogni paper. 1.3 cineca il cineca, nato nel 1969 col nome di consorzio interuniversitario per la gestione del centro di calcolo elettronico dellitalia nord- orientale, un consorzio senza scopo di lucro formato da universit italiane, nato ini

38、zialmente da quattro e attualmente comprendente trentadue universit, da ogs, dal cnr e dal ministero delluniversit e della ricerca. il suo scopo iniziale era di creare una struttura dedicata al supercalcolo scientifico, progetto economicamente insostenibile da un singolo ateneo ma reso possibile dal

39、lunione di essi in un consorzio che inizialmente vide il connubio di sforzi tra le universit di bologna, padova, firenze e listituto universitario di economia e commercio e di lingue e letterature straniere di venezia. in questa maniera venne cos installato in italia il primo supercomputer, un cdc 6

40、6000. attualmente le attivit del consorzio si articolano non solo nel settore del calcolo scientifico ad alte prestazioni, bens anche nella gestione e lo sviluppo di reti e servizi telematici, nonch nella produzione di sistemi informativi principalmente rivolti al mondo universitario. uno di questi

41、servizi quello a cui mi sono interfacciato, ossia la gestione delle informazioni relative agli atenei e agli accademici italiani. la sua banca dati raccoglie tutte le pubblicazioni italiane e potr essere utilizzata allinterno del progetto di questa tesi negli sviluppi futuri. 1.4 indici bibliometric

42、i 1.4.1 h-index di hirsch proposto da j. e. hirsch nella sua pubblicazione “an index to quantify an individuals scientific research output” (un indice per quantificare la produzione di una singola ricerca scientifica), arxiv:physics/0508025 v5 del 29 settembre 2005. vuole fornire un singolo numero d

43、i impatto accademico, combinando la quantit con la qualit. e definito assegnando ad un accademico un indice h se h delle sue n pubblicazioni hanno almeno h citazioni ciascuna e le altre (n- h) non hanno pi di h citazioni. lobiettivo quello di misurare limpatto cumulativo delle pubblicazioni di un ri

44、cercatore osservando il numero di citazioni che hanno ricevuto le sue opere. 1.4.2 g-index di egghe proposto da leo egghe nella sua pubblicazione “theory and practice of the g-index” (teoria e pratica dellindice g), scientometrics, vol. 69, n. 1 (2006), pp. 131-152. vuole migliorare lindice h dando

45、maggior peso agli articoli pi citati. e definito similmente allindice h; si prendono le pubblicazioni in ordine decrescente per citazioni di un autore, g viene assegnato se le prime g pubblicazioni hanno ricevuto citazioni almeno pari a g2. 1.4.3 h-index contemporaneo proposto da antonis sidiropoulo

46、s, dimitrios katsaros, and yannis manolopoulos nella loro pubblicazione “generalized h-index for disclosing latent facts in citation networks” arxiv:cs.dl/0607066 v1 del 13 luglio 2006. vuole perfezionare lindice h dando maggior peso agli articoli pi recenti, per riguardo verso i ricercatori che man

47、tengono un livello di attivit pi assiduo. si aggiunge un peso alle citazioni in base allanzianit della pubblicazione, dando maggior peso alle citazioni recenti e minore a quelle pi vecchie. questo peso pu essere calcolato in vari modi, in publish or perish come nel software sviluppato in questa tesi

48、 si utilizzano i parametri gamma=4 e delta=1. lanzianit viene calcolata dallanno corrente lanno di pubblicazione + 1. quindi un articolo pubblicato nellanno corrente avr un peso di 4 e le citazioni saranno quattro volte quelle originali, un articolo di quattro anni fa avr peso unitario, un articolo

49、di sei anni fa vedr le sue citazioni moltiplicate per 4/6. 1.4.4 h-index individuale proposto da pablo d. batista, monica g. campiteli, osame kinouchi,e alexandre s. martinez nella loro pubblicazione “is it possible to compare researchers with different scientific interests?” (e possibile paragonare

50、 ricerche in differenti interessi scientifici?), scientometrics, vol. 68, n. 1 (2006), pp. 179-189. lhi-index divide lh-index standard per il numero medio di autori che hanno contribuito per larticolo, in modo da ridurre gli effetti delle multi-collaborazioni. 1.4.5 h-index individuale (variante) pu

51、blish or perish ha implementato una variante dellh-index individuale che utilizza un diverso approccio: invece di dividere lh- index totale, prima normalizza il numero di citazioni di ciascuna pubblicazione dividendo il numero di citazioni per il numero di autori di quella pubblicazione, quindi calc

52、ola lh-index sulle citazioni normalizzate. questo approccio molto pi raffinato rispetto al metodo di batista e altri e riesca a tener conto pi accuratamente degli effetti della co-partecipazione e che sia unapprossimazione migliore dellimpatto per singolo autore che la pubblicazione ha, che ci che l

53、originale indice h dovrebbe far emergere. 1.4.6 awcr - tasso di citazioni pesato nel tempo lawcr ispirato alla pubblicazione di bihui jin “the ar-index: complementing the h-index” (lindice ar: complemento dellindice h), issi newsletter, 2007, 3(1), p. 6. lawcr (age-weighted citation rate) misura il

54、numero medio di citazioni su un intero corpo di lavoro di un autore, pesato per lanzianit di ciascuna sua pubblicazione. jin definisce lar-index come la radice quadrata della somma di tutte le citazioni pesate per la loro anzianit dei soli paper che contribuiscono allh-index. limplementazione di que

55、sto indice in publish or perish differisce dalla definizione di jin perch calcola la somma su tutti i paper. e law-index corrispondente la radice quadrata di questa somma. il suo valore sar simile a quello dellh-index se le citazioni rimangono pressoch costanti ogni anno. lawcrpa, ossia il numero di

56、 citazioni pesate per lanzianit e per autore, e simile allindice awcr, ma normalizzato per il numero di autori di ciascun paper. 1.5 formati bibliografici in questo capitolo saranno descritti alcuni formati strutturati esistenti per il salvataggio dei dati bibliografici, tra i quali il formato endno

57、te, lunico attualmente utilizzato dal software, nella sua variante pi semplice che si pu scaricare da google scholar. gli sviluppi futuri prevedono la creazione di altri moduli per il trattamento dei dati negli altri formati esistenti, per cui si far una breve descrizione di alcuni di essi. e da ten

58、ere sempre in considerazione la particolari del campo autore: solitamente viene utilizzata una tag formata dalliniziale del nome seguita da uno spazio e il cognome. 1.5.1 endnote il formato dati endnote stato creato dalla thomson scientific per essere utilizzato dal loro software endnote. lelenco co

59、mpleto delle specifiche di questo formato pu essere quindi consultato visualizzando lhelp del programma. i file creati tramite il software endnote possono essere in vari formati: testo semplice, rtf (rich text format), html o xml. per gli usi del software oggetto della tesi si sviluppato un modulo p

60、er limpiego di questo formato tramite file di tipo testuale con estensione .enw, in cui ogni linea formata da un campo (tag) seguito da uno spazio e dal valore contenuto in quel campo. in base al tag vediamo nella tabella seguente quali saranno i contenuti: tagcontenutodescrizione %ttitoloil titolo

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論