Si usted es un investigador de bioinformática o un usuario de BLAST, es posible que haya encontrado situaciones en las que necesita buscar varias bases de datos juntas o buscar un subconjunto específico de secuencias dentro de una base de datos existente. Para este tipo de búsquedas, una forma conveniente de realizarlas es creando una base de datos virtual BLAST. Una base de datos virtual BLAST es una colección de secuencias que no se almacenan físicamente en un solo archivo, sino que son referenciadas por un archivo de alias que apunta a las bases de datos originales o archivos de secuencia. De esta manera, puede ahorrar espacio en disco y tiempo evitando duplicar o dividir bases de datos grandes.
Una herramienta que puede ayudarle a crear y gestionar bases de datos virtuales BLAST es blastdb_aliastool, que forma parte del conjunto de aplicaciones de línea de comandos BLAST+ desarrolladas por el Centro Nacional de Información Biotecnológica (NCBI). En este artículo le mostraremos cómo descargar y utilizar blastdb_aliastool para realizar diversas tareas relacionadas con las bases de datos virtuales BLAST.
Blastdb_aliastool es una herramienta de línea de comandos que puede crear y manipular archivos de alias para bases de datos BLAST virtuales. Un archivo de alias es un archivo de texto que contiene información sobre el nombre, título, tipo y ubicación de las bases de datos originales o archivos de secuencia que componen la base de datos virtual. Un archivo de alias también puede contener criterios de filtrado como IG (identificadores numéricos) o accesiones que limitan la búsqueda a un subconjunto de secuencias dentro de las bases de datos originales. Un archivo alias tiene una extensión de . nal para bases de datos de nucleótidos o . pal para bases de datos de proteínas.
Blastdb_aliastool puede realizar tres tipos de tareas para ayudar a crear y gestionar bases de datos BLAST virtuales:
Blastdb_aliastool está incluido en el conjunto de aplicaciones de línea de comandos BLAST+, que están disponibles gratuitamente en ftp:///ftp.ncbi.nlm.nih.gov/blast/executables/blast+/. Puede descargar el instalador ejecutable o el tarball de código fuente para su plataforma y seguir las instrucciones de instalación. Para más detalles, consulte el manual del usuario BLAST+ .
Si desea utilizar blastdb_aliastool con bases de datos NCBI BLAST, debe descargarlas desde ftp:///ftp.ncbi.nlm.nih.gov/blast/db/. Estas son las mismas bases de datos disponibles a través del servicio web público BLAST (Cómo utilizar Blastdb Alias Tool?
blastdb_aliastool -dblist "ncbi_nematode wormbase_nematode" -db nematode -title "Nematode nucleotide database" -dbtype nuclEste comando creará dos archivos: nematode.nal y nematode.nhr. El archivo nematode.nal es el archivo alias que contiene la información sobre las bases de datos originales y la base de datos virtual. El archivo nematode.nhr es un archivo de encabezado que se requiere para las búsquedas BLAST. Puede utilizar el nombre de la base de datos virtual, nematodo, como argumento para la opción -db de cualquier aplicación BLAST+.
Para crear un archivo de alias que limite una búsqueda por IG o accesiones, debe usar las opciones -gilist o -seqidlist de blastdb_aliastool. La opción -gilist toma como argumento un archivo de texto que contiene una lista de IG, una por línea. La opción -seqidlist toma como argumento un archivo de texto que contiene una lista de accesiones, una por línea. También debe especificar el nombre y el título del archivo de alias utilizando las opciones -db y -title, respectivamente. También necesita indicar el tipo de base de datos usando la opción -dbtype, que puede ser nucl para nucleótido o prot para proteína. También debe proporcionar el nombre o la ruta de la base de datos original que contiene las secuencias utilizando la opción -dblist. Por ejemplo, para crear un archivo de alias que limite la búsqueda a un subconjunto de ARNm RefSeq de C. elegans dentro de una base de datos de ARNm nematodo más grande llamada ncbi_nematode_mrna, puede usar el siguiente comando:
blastdb_aliastool -seqidlist c_elegans_refseq_mrna.txt -db c_elegans_refseq_mrna -title "C. elegans RefSeq mRNA subset" -dbtype nucl -dblist ncbi_nematode_mrnaPara convertir un GI o una lista de acceso a formato binario, debe usar la opción -bin de blastdb_aliastool. La opción -bin toma como argumento un archivo de texto que contiene una lista de GIs o accesiones, una por línea. También necesita especificar el nombre del archivo binario de salida usando la opción -out. También necesita indicar si la lista de entrada contiene IG o accesiones usando la opción -input_type, que puede ser gi o acc. Por ejemplo, para convertir una lista de accesiones en swissprot_accessions.txt a formato binario en swissprot_accessions.bin, puede usar el siguiente comando:
blastdb_aliastool -bin swissprot_accessions.txt -out swissprot_accessions.bin -input_type accEste comando creará un archivo: swissprot_accessions.bin. Este archivo es una representación binaria de las accesiones en swissprot_accessions.txt que solo contiene accesiones en la base de datos SwissProt. Este archivo puede utilizarse como argumento para la opción -seqidlist de blastdb_aliastool o cualquier aplicación BLAST+.
Una de las principales ventajas de blastdb_aliastool es que puede ayudarle a ahorrar espacio en disco y tiempo al crear bases de datos BLAST virtuales. Al usar archivos de alias, puede evitar copiar o dividir grandes bases de datos, lo que puede ocupar mucho espacio y tiempo en disco. En su lugar, puede hacer referencia a las bases de datos originales o archivos de secuencia utilizando los archivos de alias, que son mucho más pequeños y rápidos de crear. De esta manera, también puede mantener sus bases de datos actualizadas sin tener que volver a crear los archivos de alias cada vez.
Una tercera ventaja de blastdb_aliastool es que puede ayudarle a mejorar su eficiencia de búsqueda y rendimiento mediante la conversión de GI o listas de acceso a formato binario. Mediante el uso de formato binario, puede reducir el tamaño y la complejidad de los criterios de filtrado, lo que puede acelerar el proceso de búsqueda y reducir el uso de memoria. También puede asegurarse de que sus criterios de filtrado solo contienen indicaciones geográficas válidas o accesiones en la base de datos, lo que puede evitar errores o inconsistencias en los resultados de búsqueda.
Blastdb_aliastool es una herramienta potente y versátil que puede ayudarle a crear y gestionar bases de datos BLAST virtuales. Al utilizar blastdb_aliastool, puede ahorrar espacio y tiempo en disco, personalizar sus búsquedas y bases de datos y mejorar su eficiencia y rendimiento de búsqueda. Blastdb_aliastool forma parte del conjunto de aplicaciones de línea de comandos BLAST+, que están disponibles gratuitamente en NCBI. Para obtener más información sobre blastdb_aliastool y otras herramientas BLAST+, visite el sitio web <a href=">BLAST+ </a>. </p></div><div> <h2>Preguntas frecuentes</h2></div><div><h4>Qué es una base de datos virtual BLAST? </h4></div><div><p>Una base de datos virtual BLAST es una colección de secuencias que no se almacenan físicamente en un solo archivo, sino que son referenciadas por un archivo de alias que apunta a las bases de datos originales o archivos de secuencia. </p></div><div><h4>Qué es un archivo de alias? </h4></div><div><p>Un archivo de alias es un archivo de texto que contiene información sobre el nombre, título, tipo y ubicación de las bases de datos originales o archivos de secuencia que componen la base de datos virtual. Un archivo de alias también puede contener criterios de filtrado como IG o accesiones que limitan la búsqueda a un subconjunto de secuencias dentro de las bases de datos originales. </p></div><div><h4>Cómo puedo crear un archivo de alias? </h4></div><div></div><div></div><div><h4>Cómo puedo usar un archivo de alias? </h4></div><div><p>Puede usar un archivo de alias como argumento para la opción -db de cualquier aplicación BLAST+. Por ejemplo, si tiene un archivo de alias llamado nematode.nal que combina dos bases de datos de nucleótidos de nematodos, puede usarlo de la siguiente manera:</p></div><div><code>blastn -query query.fasta -db nematode</code></div><div><h4>Cómo puedo convertir un GI o lista de acceso a formato binario? </h4></div><div><p>Puede usar blastdb_aliastool para convertir un GI o lista de acceso a formato binario especificando la opción -bin con un archivo de texto que contenga una lista de IG o accesiones, una por línea, la opción -out con el nombre del archivo binario de salida, y la opción -input_type con gi o acc. </p> 17b9afdd22</div><div></div><div></div><div></div><div>https://groups.google.com/g/lansophacep/c/DyzlUCjfmN0 https://groups.google.com/g/ovocabstyn/c/LqJ21suPJOE https://groups.google.com/g/anavbrazav/c/knOZjPo5iqI </div>