๐ ไธป้กต โข English
ๅ็ป่ RNA ๆตๅบๆฐๆฎๅๆๅฎๆดๆๅ
๐ ๆฆ่ฟฐ โข ๐ ๆไปถๅๅค โข ๐ ๅ่ๆฐๆฎๅบ โข ๐ ไธปๆต็จๅๆ โข ๐ ็ปๆ่งฃๆ
ๆฌๆๆกฃๆจๅจๆไพไธไปฝๅฎๆด็ๆๅ๏ผ่ฏฆ็ปไป็ปๅฆไฝไฝฟ็จ dnbc4tools ๅฏนๅ็ป่ RNA ๆตๅบๆฐๆฎ่ฟ่กๅๆใ
ๅทฅไฝๆต็จ๏ผๅๅงๆฐๆฎ โ ่ดจ้ๆงๅถ โ ๆฏๅฏน โ ็ป่่ฏๅซ โ ่กจ่พพ็ฉ้ต โ ๅๆๆฅๅ
$dnbc4tools ไปฃ่กจๅฏๆง่ก็จๅบ่ทฏๅพ๏ผ้ๆฟๆขไธบๆจ็ๅฎ้
ๅฎ่ฃ
่ทฏๅพใๆข่ก็ฌฆ `\` ็จไบๅจๅฝไปค่กไธญๅฐๅฝไปคๅไธบๅค่ก๏ผไปฅๆ้ซๅฏ่ฏปๆงใ
ๅๆ้่ฆไธค็ง็ฑปๅ็ FASTQ ๆไปถ๏ผ
| ๆไปถ็ฑปๅ | ่ฏดๆ |
|---|---|
| cDNA ๆๅบ | ๅ ๅซ Cell BarcodeใUMI ๅ่ฝฌๅฝ็ปไฟกๆฏ็ๆตๅบๆฐๆฎใ |
| Oligo ๆๅบ | ๅ ๅซๅคงๅฐ็ฃ็ ็ Cell Barcode ไฟกๆฏๅๅฐ็ฃ็ ็ UMI ไฟกๆฏใ |
| ๆไปถ็ฑปๅ | ๆ ผๅผ | ่ฏดๆ |
|---|---|---|
| ๅบๅ ็ปๆไปถ | FASTA | ๅ ๅซ็นๅฎ็ฉ็ง็ๅฎๆดๅบๅ ็ปๅบๅ๏ผ้ๅธธๆฏไธป่ฃ ้ ็ๆฌ๏ผ๏ผๆถต็ๆ่ฒไฝใ็บฟ็ฒไฝๅๅ ถไป้ไผ ไฟกๆฏใ่ฏฅๆไปถๆฏๅบๅ ็ปๆฏๅฏนๅๅๆ็ๅบ็กใ |
| ๆณจ้ๆไปถ | GTF | ่ฏฆ็ปๆ่ฟฐๅบๅ ็ปไธญ็ๅบๅ ใ่ฝฌๅฝๆฌใๅคๆพๅญ็ญๅ่ฝๅบๅใๆญคๆไปถๆ็กฎไบๅบๅ ็ไฝ็ฝฎใ็ฑปๅๅ็ธๅ ณๅฑๆงใ |
$dnbc4tools tools mkgtf ่ฟ่ก่ฟๆปคใ
GTF ๆไปถ่ฆๆฑ๏ผ
gene ๆ transcript ็ฑปๅไปฅๅ exon ็ฑปๅ็ๆณจ้ใgene_id ๆ gene_name ไปฅๅ transcript_id ๆ transcript_nameใไป ENSEMBL ๅ UCSC ็ญ็ฝ็ซไธ่ฝฝ็ GTF ๆไปถ้ๅธธๅ ๅซๅค็ง็ฑปๅ็ๅบๅ ใๆ นๆฎๆจ็็ ็ฉถๅ ด่ถฃ้ๆฉ็นๅฎ็ๅบๅ ็ฑปๅ่ฟ่กๅๆ๏ผๅฏไปฅๆๆๅๅฐๅบๅ ๆณจ้็้ๅ ๏ผไป่ๆ้ซๆฏๅฏน็ๅฏไธๆงใไธๅคไธชๅบๅ ้ๅฏไธๆฏๅฏน็ reads ไผ่ขซ่ฟๆปคใ
ๆไปฌๆไพไปฅไธไธ็ง GTF ๆไปถๅค็ๅ่ฝ๏ผ
| ๅ่ฝ | ่ฏดๆ |
|---|---|
| ๅบๅ ็ฑปๅ็ป่ฎก | ็ป่ฎก GTF ๆไปถไธญๅๅบๅ ็ฑปๅ็ๆฐ้ใ |
| GTF ๆไปถๆ กๆญฃ | ๅกซ่กฅ็ผบๅคฑไฟกๆฏ๏ผ็กฎไฟ GTF ๆไปถ็ฌฆๅๅๆ่ฆๆฑใ |
| ๅบๅ ็ฑปๅ่ฟๆปค | ๆ นๆฎ็ ็ฉถ้่ฆ็ญ้็นๅฎๅบๅ ็ฑปๅใ |
# ็ป่ฎกๅบๅ ็ฑปๅๆฐ้
$dnbc4tools tools mkgtf \
--action stat \
--ingtf genes.gtf \
--output gtfstat.txt \
--type gene_biotype
type ็็ฑปๅใ
่พๅบ็คบไพ๏ผ
$cat gtf_type.txt
Type Count
protein_coding 20006
lncRNA 17755
processed_pseudogene 10159
unprocessed_pseudogene 2605
misc_RNA 2221
snRNA 1910
miRNA 1879
TEC 1056
transcribed_unprocessed_pseudogene 950
snoRNA 943
transcribed_processed_pseudogene 503
rRNA_pseudogene 497
IG_V_pseudogene 187
transcribed_unitary_pseudogene 146
IG_V_gene 145
......
ๅฝ GTF ๆไปถๅ ๅฎนไธๅฎๆดๆถ๏ผไธปๅๆๆต็จๅฏ่ฝไผๅ ๆ ๆณๅฎๅ จๆณจ้่ไธญๆญใๆญคๅ่ฝ่ฝๅค่ชๅจๅกซ่กฅๅบๅ ๏ผgene๏ผไธ่ฝฌๅฝๆฌ๏ผtranscript๏ผๆก็ฎไธญ็็ผบๅคฑไฟกๆฏ๏ผ็กฎไฟๆต็จ้กบๅฉ่ฟ่กใ
# ๆ กๆญฃGTFๆไปถ
$dnbc4tools tools mkgtf \
--action check \
--ingtf genes.gtf \
--output corrected.gtf
่ฝฏไปถไผๆ นๆฎ gene_id ๅ gene_name ไปฅๅ transcript_id ๅ transcript_name ไบ็ธๅกซ่กฅ๏ผๅนถๆ็คบๅฏ่ฝๅญๅจๅคไธชๅบๅ ไฟกๆฏ็ไฝ็ฝฎใ
# ๅบๅ ็ฑปๅ่ฟๆปค
$dnbc4tools tools mkgtf \
--ingtf genes.gtf \
--output genes.filter.gtf \
--type gene_biotype
้ป่ฎคๅ ๅซ็ๅบๅ ็ฑปๅ๏ผ
protein_coding
lncRNA/lincRNA
antisense
IG_V_gene
IG_LV_gene
IG_D_gene
IG_J_gene
IG_C_gene
IG_V_pseudogene
IG_J_pseudogene
IG_C_pseudogene
TR_V_gene
TR_D_gene
TR_J_gene
TR_C_gene
ๆจไนๅฏไปฅไฝฟ็จ include ๅๆฐ่ชๅฎไน้่ฆไฟ็็ๅบๅ ็ฑปๅ๏ผ
# ่ชๅฎไนๅบๅ ็ฑปๅ่ฟๆปค
$dnbc4tools tools mkgtf \
--ingtf genes.gtf \
--output genes.filter.gtf \
--type gene_biotype \
--include protein_coding,lncRNA,lincRNA,\
antisense,IG_V_gene,IG_LV_gene,IG_J_gene,\
IG_C_gene,IG_V_pseudogene,IG_J_pseudogene,\
IG_C_pseudogene,TR_V_gene,TR_D_gene,TR_J_gene,TR_C_gene
ๅจๆง่ก dnbc4tools rna run ๅๆๅ๏ผๅฟ
้กปๅ
ๆๅปบๅ่ๆฐๆฎๅบใๆญคๆญฅ้ชคๅฉ็จๆณจ้ๆไปถ๏ผGTF๏ผๅๅ่ๅบๅ ็ป๏ผFASTA๏ผๅๅปบ็ดขๅผ๏ผ็จไบๅ็ปญๆตๅบ reads ็ๆฏๅฏนๅๆณจ้ใ
# ๆๅปบๅ่ๆฐๆฎๅบ
$dnbc4tools rna mkref \
--fasta genome.fa \
--ingtf genes.gtf \
--species Homo_sapiens \
--threads 10
่พๅบ็ปๆ๏ผ
ๆๅ่ฟ่กๅ๏ผๅฐๅจๆๅฎไฝ็ฝฎๅๅปบๅ่ๆฐๆฎๅบ็ฎๅฝ๏ผๅ ๅซไปฅไธๆไปถ็ปๆ๏ผ
/opt/database/Homo_sapiens
โโโ fasta
โ โโโ genome.fa
โ โโโ genome.fa.fai
โโโ genes
โ โโโ genes.gtf
โโโ ref.json
โโโ star
โโโ chrLength.txt
โโโ chrNameLength.txt
โโโ chrName.txt
โโโ chrStart.txt
โโโ exonGeTrInfo.tab
โโโ exonInfo.tab
โโโ geneInfo.tab
โโโ Genome
โโโ genomeParameters.txt
โโโ mtgene.list
โโโ SA
โโโ SAindex
โโโ sjdbInfo.txt
โโโ sjdbList.fromGTF.out.tab
โโโ sjdbList.out.tab
โโโ transcriptInfo.tab
ๅ
ถไธญ ref.json ๆไปถ่ฎฐๅฝไบๆฐๆฎๅบ็ไธป่ฆไฟกๆฏใ
{
"chrmt": "chrM",
"genome": "/opt/database/Homo_sapiens/fasta/genome.fa",
"genomeDir": "/opt/database/Homo_sapiens/star",
"gtf": "/opt/database/Homo_sapiens/genes/genes.gtf",
"input_fasta_files": [
"genome.fa"
],
"input_gtf_files": [
"genes.filter.gtf"
],
"mtgenes": "/opt/database/Homo_sapiens/star/mtgene.list",
"species": "Homo_sapiens",
"version": "dnbc4tools 3.0"
}
่ฟ่กๆถๅฐๆๅฐๅฆไธไฟกๆฏ๏ผ
2025-11-12 15:56:12 Creating new reference folder at /opt/database/Homo_sapiens
...done
2025-11-12 15:56:12 Writing genome FASTA file into reference folder...
...done
2025-11-12 15:56:14 Indexing genome FASTA file...
...done
2025-11-12 15:56:15 Writing genes GTF file into reference folder...
...done
2025-11-12 15:57:11 Generating STAR genome index...
...done
2025-11-12 15:59:29 Writing Reference JSON file into reference folder...
...done
Analysis Complete
ไธบ็ฎๅๅคๆ ทๆฌๅๆๆต็จ๏ผๆจๅฏไปฅไฝฟ็จ้ ็ฝฎๆไปถๆน้็ๆ้ๅฏนๆฏไธชๆ ทๆฌ็ shell ่ๆฌใ
$dnbc4tools rna multi \
--list sample.tsv \
--genomeDir /opt/database/Homo_sapiens \
--threads 30
ๅ
ถไธญ sample.tsv ๆไปถไฝฟ็จๅถ่กจ็ฌฆ (\t) ๅ้๏ผๅ
ๅซไธๅ๏ผ
| ๅ | ๅ ๅฎน |
|---|---|
| 1 | ๆ ทๆฌๅ็งฐ |
| 2 | cDNA ๆๅบๆตๅบๆฐๆฎ |
| 3 | Oligo ๆๅบๆตๅบๆฐๆฎ |
sample1 /data/cDNA1_R1.fq.gz;/data/cDNA1_R2.fq.gz /data/oligo1_R1.fq.gz,/data/oligo4_R1.fq.gz;/data/oligo1_R2.fq.gz,/data/oligo4_R2.fq.gz
sample2 /data/cDNA2_R1.fq.gz;/data/cDNA2_R2.fq.gz /data/oligo2_R1.fq.gz;/data/oligo2_R2.fq.gz
sample3 /data/cDNA3_R1.fq.gz;/data/cDNA3_R2.fq.gz /data/oligo3_R1.fq.gz;/data/oligo3_R2.fq.gz
่ฟ่กๅฎๆๅ๏ผๅฐไธบๆฏไธชๆ ทๆฌ็ๆไธไธช shell ่ๆฌ๏ผ
sample1.sh
sample2.sh
sample3.sh
sample1.sh ๆไปถๅ
ๅฎน็คบไพ๏ผ
$cat sample1.sh
/opt/software/dnbc4tools3.0beta/dnbc4tools rna run --name sample1 --cDNAfastq1 /data/cDNA1_R1.fq.gz --cDNAfastq2 /data/cDNA1_R2.fq.gz --oligofastq1 /data/oligo1_R1.fq.gz,/data/oligo4_R1.fq.gz --oligofastq2 /data/oligo1_R2.fq.gz,/data/oligo4_R2.fq.gz --genomeDir /database/scRNA/Mus_musculus/mm10 --threads 30
้ๅ๏ผๆจๅฏไปฅๆง่ก่ฟไบ่ๆฌไปฅ่ฟ่กไธปๆต็จๅๆใ
RNA ไธปๅๆๆต็จๅค็ๅไธชๆ ทๆฌ็ cDNA ๅ Oligo ๆๅบๆตๅบๆฐๆฎใ่ฏฅๆต็จ็ๆ ธๅฟๆญฅ้ชคๅ ๆฌ๏ผ
ไธบๅไธชๆ ทๆฌ็ๆ่กจ่พพ็ฉ้ต็็คบไพ่ๆฌ๏ผ
$dnbc4tools rna run \
--name sample \
--cDNAfastq1 /data/sample_cDNA_R1.fastq.gz \
--cDNAfastq2 /data/sample_cDNA_R2.fastq.gz \
--oligofastq1 /data/sample_oligo1_1.fq.gz,/data/sample_oligo2_1.fq.gz \
--oligofastq2 /data/sample_oligo1_2.fq.gz,/data/sample_oligo2_2.fq.gz \
--genomeDir /opt/database/Homo_sapiens \
--threads 30
ๅจๅฏน่ฏๅ็ๆฌๅๆๅๅบ่ชๅจๆฃๆตๅ๏ผ่ฝฏไปถๅผๅง่ฟ่กๅๆ๏ผไปฅไธๆฏไธไธช็คบไพ๏ผ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโ Parsed FASTQ Inputs โ 2025-11-12 15:00:24 โโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ Type โ Path โ
โโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ cDNA Read1 โ /data/test_cDNA_R1.fastq.gz โ
โ cDNA Read2 โ /data/test_cDNA_R2.fastq.gz โ
โ oligo Read1 โ /data/test_oligo_1_R1.fastq.gz โ
โ oligo Read2 โ /data/test_oligo_2_R2.fastq.gz โ
โโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโ Chemistry Detection โ 2025-11-12 15:00:31 โโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ Type โ Result โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ oligo Read1 โ darkreaction โ
โ oligo Read2 โ darkreaction โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโ Chemistry Detection โ 2025-11-12 15:00:31 โโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโฌโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โ Type โ Result โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโผโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโค
โ cDNA Read1 โ darkreaction โ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโดโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
โโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโโ
2025-11-12 15:00:31 Starting oligo library filtering...
...done
2025-11-12 15:05:53 Starting cDNA library filtering...
...done
2025-11-12 15:07:49 Performing read alignment and UMI counting...
...done
2025-11-12 15:15:25 Calculating bead similarity and merging beads within droplets...
...done
2025-11-12 15:15:41 Generating raw gene expression matrix...
...done
2025-11-12 15:17:24 Generating cell-filtered gene expression matrix...
...done
2025-11-12 15:17:43 Calculating sequencing saturation metrics...
...done
2025-11-12 15:18:08 Generating position-sorted BAM file...
...done
2025-11-12 15:24:46 Performing dimensionality reduction and clustering analysis...
...done
2025-11-12 15:27:21 Generating analysis report and summary statistics...
...done
Analysis Finished Elapsed Time: 0:28:56
ๅฝๅบ็ฐ Analysis Finished ๆถๆฏๆถ๏ผ่กจ็คบๅๆๅทฒๆๅๅฎๆใ
ๅๆๅฎๆๅ๏ผๅฐ็ๆ outs๏ผ็ปๆ่พๅบ๏ผๅ logs๏ผๆฅๅฟ๏ผ็ฎๅฝใouts ็ฎๅฝ็ปๆๅฆไธ๏ผ
.
โโโ analysis/
โ โโโ cluster.csv
โ โโโ marker.csv
โ โโโ QC_Cluster.h5ad
โโโ anno_decon_sorted.bam
โโโ anno_decon_sorted.bam.bai
โโโ filter_feature.h5ad
โโโ filter_matrix/
โ โโโ barcodes.tsv.gz
โ โโโ features.tsv.gz
โ โโโ matrix.mtx.gz
โโโ metrics_summary.xls
โโโ raw_matrix/
โ โโโ barcodes.tsv.gz
โ โโโ features.tsv.gz
โ โโโ matrix.mtx.gz
โโโ *_scRNA_report.html
โโโ singlecell.csv
็ธๅ ณๆๆกฃ๏ผ
ๅ ๅฎนๅพ ่กฅๅ