2014년 4월 17일 목요일

picard tools 패키지


version 1.111에 들어있는 프로그램들.
지금까지 여러 번 사용해본 게 얼마 안 되는데, (sortsam, markduplicates 등)
알아두면 괜한 작업을 줄일 수 있겠다.

AddOrReplaceReadGroups.jar
apache-ant-1.8.2-bzip2.jar
BamIndexStats.jar
BamToBfq.jar
BuildBamIndex.jar
CalculateHsMetrics.jar
CheckIlluminaDirectory.jar
CleanSam.jar
CollectAlignmentSummaryMetrics.jar
CollectGcBiasMetrics.jar
CollectInsertSizeMetrics.jar
CollectMultipleMetrics.jar
CollectRnaSeqMetrics.jar
CollectTargetedPcrMetrics.jar
commons-jexl-2.1.1.jar
commons-logging-1.1.1.jar
CompareSAMs.jar
CreateSequenceDictionary.jar
DownsampleSam.jar
- BAM 파일 내에 포함된 read들 중 일부만 가지고 즉 샘플링해서
작은 BAM 파일을 만들고자 할 때 유용.
java -jar [path]/DownsampleSam.jar INPUT=original.bam OUTPUT=sample50pct.bam TMP_DIR=picard_tmp VALIDATION_STRINGENCY=LENIENT PROBABILITY=0.50 RANDOM_SEED=null
RANDOM_SEED는 default 값이 1인데, 그대로 하면 몇 번 하든 동일한 BAM이 생성된다.
null로 설정하면 매번 다른 BAM을 생성.
- 이 코드의 좋은 점은, random sampling을 해주면서 원본 BAM의 상태를 유지해주는
특징인 것 같다. 예를 들어 매핑 위치 기준으로 sorting되어 있다면 그 순서를 헝클어뜨리지
않는다.

EstimateLibraryComplexity.jar
ExtractIlluminaBarcodes.jar
ExtractSequences.jar
FastqToSam.jar
- raw data인 fastq를 BAM 혹은 SAM으로,
단, align된 상태의 read가 당연히 아니라 unaligned BAM 파일을 만들어줌.

FilterSamReads.jar
FixMateInformation.jar
GatherBamFiles.jar
IlluminaBasecallsToFastq.jar
IlluminaBasecallsToSam.jar
IntervalListTools.jar
libIntelDeflater.so
MakeSitesOnlyVcf.jar
MarkDuplicates.jar
- align 위치 때문에 MAPQ 값 관련 오류가 나타날 수 있는데 그땐
VALIDATION_STRINGENCY=LENIENT 옵션을 추가하면 해결.

MarkIlluminaAdapters.jar
MeanQualityByCycle.jar
MergeBamAlignment.jar
MergeSamFiles.jar
MergeVcfs.jar
NormalizeFasta.jar
picard-1.111.jar
QualityScoreDistribution.jar
ReorderSam.jar
ReplaceSamHeader.jar
RevertOriginalBaseQualitiesAndAddMateCigar.jar
RevertSam.jar
sam-1.111.jar
SamFormatConverter.jar
SamToFastq.jar
snappy-java-1.0.3-rc3.jar
SortSam.jar
- 용량이 클 땐 TMP_DIR=picard_tmp 옵션을 쓰면 중간에 뻗지 않게 하여 도움이 되는 듯.

SplitVcfs.jar
tribble-1.111.jar
ValidateSamFile.jar
variant-1.111.jar
VcfFormatConverter.jar
ViewSam.jar

---

댓글 없음:

댓글 쓰기