Skip to main content

Documentos iniciales

Datos crudos

Crea una liga simbólica (ln -s) a los datos crudos, metadata.tsv y manifest.csv.

ln -s /home/luigui/rawdata . 

Ya que copiaste los archivos necesarios, lista el contenido de tus directorio rawdata .

Metadata

Veamos que contiene el archivo metadata.tsv

cat rawdata/metadata.tsv
sample-idgroup
sample_1probiotics
sample_2probiotics
sample_3probiotics
sample_4control
sample_5control
sample_6control

Archivo manifest

Qiime2 requiere de un archivo manifest que contenga la ubicación e información de los archivos fastq. Para visualizar el archivo manifest utiliza la siguiente línea de comando:

cat rawdata/manifest.csv
sample-idabsolute-filepathdirection
sample_1/home/luigui/rawdata/sample_1_R1.fastq.gzforward
sample_1/home/luigui/rawdata/sample_1_R2.fastq.gzreverse
sample_2/home/luigui/rawdata/sample_2_R1.fastq.gzforward
sample_2/home/luigui/rawdata/sample_2_R2.fastq.gzreverse
sample_3/home/luigui/rawdata/sample_3_R1.fastq.gzforward
sample_3/home/luigui/rawdata/sample_3_R2.fastq.gzreverse
sample_4/home/luigui/rawdata/sample_4_R1.fastq.gzforward
sample_4/home/luigui/rawdata/sample_4_R2.fastq.gzreverse
sample_5/home/luigui/rawdata/sample_5_R1.fastq.gzforward
sample_5/home/luigui/rawdata/sample_5_R2.fastq.gzreverse
sample_6/home/luigui/rawdata/sample_6_R1.fastq.gzforward
sample_6/home/luigui/rawdata/sample_6_R2.fastq.gzreverse

Ahora si tenemos todos los datos de entrada para comenzar con el pipeline.

Visualizar calidad de los archivos

Una de las herramientas más utilizadas para visualizar la calidad de los archivos fastq es fastqc. Para usar este comando en nuestros datos podemos utilizar los siguientes comandos:

# Para crear el directorio donde depositar los resultados
mkdir results results/00_fastqc

# Para correr fastqc en todos nuestros archivos
for s in rawdata/*gz ; do fastqc $s -o results/00_fastqc ; done

Importar los datos

Para importar los datos utiliza los siguientes comandos:

mkdir results

qiime tools import --type 'SampleData[PairedEndSequencesWithQuality]' --input-format 'PairedEndFastqManifestPhred33' --input-path rawdata/manifest.csv --output-path results/01_demux.qza

Veamos como se ven las secuencias que estamos analizando. Puedes descargar el archivo results/01.demux.qzv que acabas de generar o puedes descargarlo desde este repositorio y verlo en QIIME2view.

info

Recuerda que cada comando tiene parámetros que hay que ajustar al set de datos en cuestión. Para conocer más el tipo de datos que se pueden importar, puedes visitar esta página.