言いたいことは山のごとし(^^)

ロングリードからSVを検出するプロセスを高速化する rMFilter

 ロングリードシークエンシング技術は、ゲノムの構造変異(SV)をより正確に調べる新しい機会を提供する。 しかし、最先端のSVコールパイプラインは計算量が多く、ロングリードのアプリケーションには制限がある。著者らは、局所ゲノム領域内の短いトークンマッチに基づいて、キメラのノイジーなロングリードを効率的に特定するために、 region match-based filter(rMFilter)を提案する。rMFilterは潜在的なSV上をスパニングしているリードを直接フィルタリングすることにより、SVコールパイプライン全体の効率を改善する。 このフィルタリングは、リファレンスゲノム中のリード領域と局所領域との間の短いトークン一致の分析に基づく。 このフィルタ処理により、SVコールパイプラインに入力されたリードの数を大幅に減らすことができる。 一方、SV上をスパニングしているリードの大部分は保持することができる。

 rMFilterは、有効性を失うことなく、ロングリードベースのSV呼び出しパイプラインを加速することができる。またSV研究を容易にするために、現在のロングリードベースのパイプラインに容易に統合することができる。

 

>||

aa

||<

 

 

インストール

Github

https://github.com/hitbc/rMFilter

git clone https://github.com/hitbc/rMFilter.git
cd rMFilter/src/
make

./rMFilter-indexer 

$ ./rMFilter-indexer 

           __   __    _____   _   _                         

          /  \_/  \  |  ___| |_| | |    _                   

     _ _ |  -   -  | | |___   _  | |  _| |_    ___   _ _    

    | ^_|| | | | | | |  ___| | | | | |_   _|  / _ \ | ^_|   

    | |  | | | | | | | |     | | | |   | |_  |  __/ | |     

    |_|  |_| |_| |_| |_|     |_| |_|   \___/  \___| |_|     

 

rMFilter: Acceleration of long read-based structure variation calling by chimeric read filtering.

 

Program:   Index

Version:   V1.0

Contact:   tjiang <tjiang@hit.edu.cn>

 

Usage:     Index [Options] <HashIndexDir> <Reference>

 

Options:   -h, --help                   help

           -k, --kmerSize      <int>    kmer size of hash index [15]

 

./rMFilter-aligner 

r$ ./rMFilter-aligner 

           __   __    _____   _   _                         

          /  \_/  \  |  ___| |_| | |    _                   

     _ _ |  -   -  | | |___   _  | |  _| |_    ___   _ _    

    | ^_|| | | | | | |  ___| | | | | |_   _|  / _ \ | ^_|   

    | |  | | | | | | | |     | | | |   | |_  |  __/ | |     

    |_|  |_| |_| |_| |_|     |_| |_|   \___/  \___| |_|     

 

rMFilter: Acceleration of long read-based structure variation calling by chimeric read filtering.

 

Program:   Alignment

Version:   V1.0

Contact:   tjiang <tjiang@hit.edu.cn>

 

Usage:     Alignment [Options] <HashIndexDir> <Reads>

 

Options:   -h, --help                   help

           -t, --threads       <int>    number of threads [1]

           -r, --ratio         <int>    candidate ratio [0.05]

           -k, --kmerSize      <int>    kmer size of hash index [15]

  

ラン

1、indexを作成する。

mkdir index #出力フォルダを作成
rMFilter-indexer --kmerSize 15 index/ reference.fa
  • -k, --kmerSize [INT]   The size of the k-mers extracted from the reference genome for indexing. [15]

2、アライメントとフィルタリングを実行する。

rMFilter-aligner --kmerSize 15 -t 20 index/ long_reads.fq

 

rHAT-alignerと同じくsegmentation errorを起こした。改善したら追記します。 

 

>||
ここにソースを書く

||<

 

引用

rMFilter: acceleration of long read-based structure variation calling by chimeric read filtering.

Bioinformatics. 2017 Sep 1;33(17):2750-2752.

Liu B, Jiang T, Yiu SM, Li J, Wang Y