Ncbix :: Bigfetch.

Recupero robusto Sequenza di sequenza NCBI molto grande Set di risultati in base alle ricerche di parole chiave usando NCBI EUTILS
Scarica ora

Ncbix :: Bigfetch. Classifica e riepilogo

Annuncio pubblicitario

  • Rating:
  • Licenza:
  • Perl Artistic License
  • Prezzo:
  • FREE
  • Nome editore:
  • Roger A Hall
  • Sito web dell'editore:
  • http://search.cpan.org/~rogerhall/

Ncbix :: Bigfetch. Tag


Ncbix :: Bigfetch. Descrizione

Recupero robusto Set di risultati di sequenza NCBI molto grande in base alle ricerche di parole chiave usando NCBI EUTILS NCBIX :: BigFetch è un modulo perl utile per il download di set di sequenze di risultati molto grandi da NCBI data una query di testo. Il suo primo utilizzo ha avuto oltre 11.000.000 sequenze come risultato di una singola ricerca di parole chiave. Utilizza YAML per creare un file di configurazione per mantenere lo stato del progetto nel caso in cui i problemi di rete o del server interrompe l'esecuzione, nel qual caso potrebbe essere facilmente riavviato dopo che gli ultimi dati batch.Download è organizzato da "ID progetto" e "Directory base" e salvato e salvato nei file di testo. Ogni file include l'ID del progetto nel suo nome. I tasti Project_ID e Base_Dir sono gli unici tasti richiesti, sebbene tu riceverai la stessa ricerca di "apoptosi" ogni volta se non si imposta anche il tasto "Query". In ogni caso, una volta avviato un progetto, ha bisogno solo dei due parametri da ricaricare.Besides i file di dati, due altri file vengono salvati: 1) Il risultato della ricerca iniziale, che include il tasto WebENV e 2) un file di configurazione , che salva i dati analizzati e viene utilizzato per raccogliere il download e recuperare i lotti o sequenze mancanti. I risultati sono ritenuti in lotti a seconda del tasto "RETDING_MAX". Per impostazione predefinita, il "indice" si avvia a 1 e i download continua fino a quando l'indice supera "Contazioni" Gli errori. Boccasionalità avvengono e interi lotti non vengono scaricati. In questo caso, il "indice" viene aggiunto all'elenco "mancante". Questo elenco viene salvato nel file di configurazione. I lotti mancanti devono essere scaricati ogni giorno, e non salvati fino alla fine degli script di funzionamento completo. La lavorazione della lavorazione della lavorazione è inclusa nella directory dello script: Fetch-all.pp Fetch-Missing.pp Fetch-non disponibile.PPIL il flusso di lavoro consigliato è: 1. Copia gli script e modificali per un progetto specifico. Utilizzare un nuovo numero come ID del progetto. 2. Inizia il download eseguendo Fetch-all.pp, che invierà prima una query e salva il tasto WebENV risultante in un file di configurazione specifico del progetto (utilizzando YAML). 3. La mattina successiva, uccidi il processo di recupero-all.pp e eseguire fetch-mancante.pper finché non completa. 4. Riavvia Fetch-all.pp. Se desideri ristabilire sequenze "non disponibili", potresti eseguire recupero-non disponibile.pp. Tuttavia, verranno scaricati alla fine di Fetch-all.pp se completa normalmente. Se il set di risultati della query è così grande che i tuoi tempi di webenv, iniziano semplicemente un nuovo progetto con quell'ultimo indice del progetto precedente, ed è Raccoglierà il risultato impostato da lì (con un nuovo webenv). (L'aggiornamento pianificato avvia automaticamente un'altra ricerca.) Attenzione: potresti perdere una (molto) poche sequenze se il download si estende su più progetti. Tuttavia, i nostri test mostrano che i lotti generati con la stessa query entro pochi giorni l'uno dall'altro sono in gran parte identici.synopsis usa NCBIX :: Bigfetch; # Parametri My $ PARAMS = {Project_ID => "1", Base_Dir => "/ Home / User / Data", db => "proteina", query => "apoptosis", return_max => "500"}; # Start Project My $ Project = NCBIX :: Bigfetch-> Nuovo ($ params); # Amo quello con cui sei con stampa "Autori:". $ Project-> Autori (). "\n"; # Tentativo Tutti i lotti di sequenze while ($ Project-> Risultati_Waiting ()) {$ Project-> Get_Next_Batch (); } # Prendi i lotti mancanti mentre ($ Project-> Missing_Batches ()) {$ Project-> get_missing_batch (); } # Trova ID non disponibile My $ IDS = $ Project-> non disponibile_ids (); # Recupera ID non disponibile Foreach My $ ID (@ $ IDS) {$ Project-> Get_/esequence ($ ID); } Requisiti: · Perl.


Ncbix :: Bigfetch. Software correlato