grab -E

25 views
Skip to first unread message

Wannes Dermauw

unread,
Jun 21, 2016, 2:24:06 PM6/21/16
to biopieces
Hi I'm using the grab command to extract sequences from a fastq file using a list of sequence IDs (see attached):

read_fastq -i R1_fastq | grab -E Sanger_EST_reads_to_be_filtered_from_Sanger_bam.txt -v | write_fastq -xo R1_filter.fastq

but the resulting R1_filter.fastq stays empty

  Records grabbed: 0
  Records missed: 594534
  Patterns used: 90144

If anyone could help me out with this (probably simple) issue, that would be great!

Wannes

list of sequence IDs (see also attached)

@gnl|ti|2267696790_CCZB9998/1
@gnl|ti|2267696788_CCZB9997/1
@gnl|ti|2267696792_CCZB9999/1
...

the fastq file looks like this:

@gnl|ti|2267696784_CCZB9995/1
ACGGGGGCGGCGCGCCAAACGAATGGTCTAGAAAGCTTCTCGAGGGCCGAGGCGGCCTTTTTTTTTTTTTTTTTTAGTATATATATATGTATGTGAGTACAACGATGATAAACAAATTACAACCAATAAAGCAACCCACAATGATTTAAAGAAGCCAACTGAGATGAGCAAAACAAAAAGCTAAGGGTGGATTAAATTGTTCACAATATGGACAGTGTTCAAGATGGAAATATGATGCTGAATCAAGTGAATTAGGTAGGTAAATGGTGTGTTTAGAGCCAATCATAATCCATAATGATCATCATTTGACCGGGTCATTTGTATACATTTGAATAATTGTGTGATCTGAAGGTTAACAAGTCAGACAAGGGTAATTCAATGTGTCTATAAGATGATTATTTTTAATGGTAATCATTGGGAATGGTGATCAGGTTATCCTTGTTCATTTGATTACGTGGTTCTCAGTGAATCTGAGAAGGTTAATTTGATTGCTCACAATTGATTCTCAGAGAGAAGTGGGTAACCAGTGGAGCAACTTTACCATGTAAACAACTGTACAGTCCCAAAATTACAATACAACCAAAACAGCATTTCCATGTATATTAGTCCTGTTTTGGGCTTTAATAATGCTAAATTTATCCAAGGTTGACTTCAAGTCTTGGGAAGATTTTATCATCTCTCATCACTATATTGCTGGGTTGACACCAAGGATAAAAAATTTATCTAAAGAATCTTTATCATTTCTGTCCTTTTCTGTCTTTTTTTTGTCTTCATCCTTTCTCATTGTTTTCTAACACAATACTGTGCTATTTGGACTTCTAATCATTGTCTTTTCTCTCGTTTGTTTCAGGTTTACTCACAATCTGGTACCAT
+
(%&&'(%2'+)+*./(30+-F>01X8+RH@C8?/88UTTUTUM^XB1PTLJI6ZL8ZZZ^^^^^^^^^^^^^^^SHSSSSRUUUX^^\\\W\\\W\\\\\N\\\\\W^\\^\\\\\^S\\NW\\R\\\^\\\\Z\\PW\\\\\\\\\\\\\Z^W\\W\\WWWE\\\\\\\ZZ\\\\\\\\\\\\\\\W\\\\\\^^^\\\\\W\\ZW\\\\\\\\\\\\\\\\^WZ\\\\\\\\^\\\\\^\\\\\\\\^^\\\\\\\\\\\^^\\\G\QSQTSSU^UZSD^^UZZ^ZSZURZZZQZLGQTUSZS^ZUZSZZ^ZZ^Z^^ZUZZZZZQ^ZZZ^^Z^^^ZQQLL^^LXUUZZUXZZ^ZZRZLZXUDNTJTT^PU^^UUPTTTTTTTUTTUHUHPDR^JLXX^^^FH^U^PL^XUPTRTXR^^^N^L=UUKTTR^RXUUUTRUTCUXDMX^XLGLTXKTXTCUUTUUUM^UGAHUC^@^PMU5JRUB^XXM=XPPTT:T>XRLUT<XTJTGIXLTJTXFCTXTDDFFU8T?GFTGICGTIPPGONAITATXUT5TOOTD;T/NIPXU<XX=DUGO9GOFOC=85,UNN?9JM9.PMAC5HI:3@?A3P>J@M>@1MMJTT=9>H>AEC7?IB8>5P?JTD>?=E98AM1>>>>;?6*:7>>6BLN>4;>=/RIA->?A>EI>>:><>87>>?5><8@D<RC'0>8486A,A,A>=>NNMR>@N5238>-N8/;<:3+C-71252R272I4B>5RR75-9(F;HREE>A39)C0601<;A,D*2'%10,E,A@*0,:23,,(*$%-)<0%+,/.C3*+71..'(/75C20->,16=>+((,.'9&@-7*=11*75)>27-*%%&*8),+.+5%+1&&
@gnl|ti|2267696786_CCZB9996/1
TCGGGGGGCCGGCGCCGCCAACGAATGGTCTAGAAAGCTTCTCGAGGGCCGAGGCGGCCTTTTTTTTTTTTTTTTTTTGGTCTTTATCAAAAGTTTAATGATTAAAAAAATTAAATACTAGCCAGGTAATCACGAACTTCTGAAGGAGTTAATCGACGAAAACCTTTTTTATCGCAAACACCGATTTCTATATTATCAGCAGTCATCTGGCCTTCAAATCCTTCTTTGAGAGTCAGAATAGCTGTGTGAATAGCATCTTCCAATTCAAGATCCTCGCTGTACCGCTTTTCCAAGAATGATTTTCCATTGACATGATTTTTACCCAAAGCGGTAGCTTTCCAGGCGAAATAAGCGCCCGAGGGATCACATTGGAACAATGAAGGCTTATTCTTGTCCCAGCCAGCAATGAGCAGAGATACACCAAATGGTCTAACACCTCCTGATTGTGTGTATTCTTGCATGATGTAGGCAACCCGTTGAACTAATTGAGATGTTGGAATAGGTTCATCGTACATTGATTGATATTTTTGGGCAATTTTGCGAGCTTTCCTGACCAAAAGACGATAATCAGGTCCCATTCCACTATAAACCATTCCAATGTGTTCAGTGATTGCTTCTATTTTGAAAATACTATGCTCTTCATTAAGTATAGACTTCTGTTTCTTTTCCGTAGCTAGAACTACTCCATTTGAAGCTTTAATAGCAGTAGAGTTTGCTCCAGAGGCAACAGCAGCCCAAGGCATATTCAATTTGAACCAATTTTCCAGAGGACTGAAGGTGGTTAGAGAAAAACTATTATCTTTCCGAGTCATATAACCGCTGACAATTGACATGAAAAACATTATAAACATCAAACTGAAATTACCCACACCCCCGC
+
$%(+(&+&''',)4&&))('*+4B>7X;/TCAG5(:B8P^UU^KR^^6,JPT^J7^J9Z^^^^^^^^^^^^^^^^^ZZZEAIC;=GTRGCLL\WWQN\WWWWGW^\^\\\WS\\ZWWW;=NW\N\ZJJ\\\N\FZ\\\\WW\\ZZ\\W\\\W\\\\\W\\\\\ZZ\ZZZ\\\WNNNR\\W\\W\\N\WWW\R\M\\\\WW\\\\\\\\Z\N\\Z\R\\\\\WWWWW\\\W\\\\\\^\\WLZ\\\W\\\\\\\\ZWZZ\\\\\\\\\\\URZZZZTRZZZZUZQQZTZZZSBTRZSQZUSZZZZSQZZZQTQQZSQZZZSZUZSQZZZZZNTTZZZZZTQCTZILZZXZZZZQLNZZZPLZZLDZTZZ^^^PZZZRZPZZZPXPTTUUTUUTPTTTL8GLNITTTTTXULMTDUPGMTXPUJIT^U^UTUUUT^P^^U^^CTRHPTKIKTATUR^TUUTGMTP;LJTT^T1^P^RRJFRTUTTTXT^^PLXCCCPURTMMTIJGPUJRURPUTTLRLLALUHBGLRLLCRXUDPTIXXXIBCTFGXUIPRFUT<@8TXXBTGMU@<IIAENX6ADPETTUE8OTDP?XFIP@MPXP9PIU8>@PL@XIP@>LF@MMNAAAMPM??TTPANNGNAM@TNN>>??=BN=>?FPDMD8PI>>;MLA=TTG=L@57-9=9L>EDD?>>=E49R=>C>=CCR=?;=>7>?C:?@M73R>97D8C65F-7>85>9>G8>/G178777?>9>BE*80LCA8679+4BRI<-7)5+%'>A>>-5%%&7>'-C>DD@RRR8''$$+063>BA04.B)6>5>-0+-),88(0)<&./,>0-5.:4<:=9+*&*3*6;1()(1-3)++;/>)212(:%/*-(46:1/&
@gnl|ti|2267696788_CCZB9997/1
TCGGGGGCCGCGCGCCCAAACGAATGGTCTAGAAGCTTCTCGAGGGCCGAGGCGGCCTTTTTTTTTTTTTTTTTTACAGATAAATGATAACTCAGAGGCTTTCATTTCGTGTTCATCAACAGAAAGATGCTTTCTTTACAATCAACAAATAAAACTATGAAATGATGATAATCTGGTATTTCTGCCTTTCTCCATCATTTTTATCAGCAAATGCACCAAAAACAGTTTACAACAGCTATTAAATGTATTGCGAGTAAACATGGATTAAGCCTGAGCTTTTTACCAAGACTTGGGTTGCCTTTTGACTTGTTTATCGTTCCTTTGCTTTAACCTTGCCTGTCTATGGGAATGATAATAACTCCATCATTCATTACATTTCCAGGTTAATTGAGCCTTGAACTTTTGTAGCCTTTTTTTCCTCAATCTTTACTTTCCTTTCCATGGTGGCCACACTAGTGTTTCACAATTAACCACTCTGTCTGTGTCTCTTTCTATTTTTTTCCTTCGTTGTCTACTTTTCTATCCTCATCAAGTTTCGTGGGATCGGTGAAAATCGCATCGCTAAATGATCCGTTCATCCATATAAATAACATTGTAAAAAACAACCAGACAAAGTCTTTTCCATCCTTTTGCATTAATAACTTTTCCATCTTTAACCTTTTTTTTCCAGATTCAGCTCAACAATTAACCTTCATCACTTGCGGAATACCGAACATTGATTAACATTTCTTGATTGATAAAATATAATTGAGTAAATTTAGCGCTCGCAACCGACCCCAACAGGTAACTCATTTTACCTCTCTCTCTCCTTCACCCCAGGCCGTAATGGCCGAATTCCCGAGCATATGTCCCGTACCGTCGACTGATACTC
+
)%%+,''((*))*+(+++'86I99:^6/UDI+*()1P^XUULL^T-+NNZUL7^J7Z^^^^^^^^^^^^ZLL^^\RR>=WW\ZZ\\\\WWW\NNM\\\WZZ\\\\\\\WN\WWWG\\\WML\\ZHZ\\\\ZZ\\WZ\\\RWW\RWLR\\\^^\\\\\\\\\\WW\NW\\\\\\\Z\W\\\\\Z\\\\\\\ZZSL\\\\\\^\\\\\\\\^^\\ZW\\\ZZZZ\\\\\\\\WZ\\W\\\\^^^^\\\\\\\SW\\\\\\\\\\^\\\^^\\^\\\\\^^^^^^\\\\\\\\^^\^WW\\\\\^\\\UZZZITRZUZSRZZZZZZSSZZUZZZZZZZZZQZLIQL^^^Z^^SZXTZQZZZZZZLQZXZUZQZTU^ZZ^^^ZL8ZZMINNUZZZTUZZZZX^U^^^UTTUTTXP^^^^TTTUTMLUX^TX^^^XXUUNMT^T^PX^^L^UT^PXJUUXUM^TTTNHUGUUXXU^XH^T^TPMRRKK^RRRXTR^^R^^^^X^^^^^CTTRIUUDPLT^RXXXMCLTXU@T@RACGPLXTXHCXXXT2UPU?TTXXGAR6GGRUMG@+XHTTI7XUI8TI@MPXAPLT;XFG7FDDPUU>LXXXUM@;OFA:CPP>XRI<E@RRT?//FA8,PPP5?>A?<MAMN=>RMI>?;I>@NN/@0>>NNMMNTPAE5,>;5?7BAL=>=>3=>>>>4E>E>?D>?>;=>/;5>@1>888@>0=9C=6-.,(9:8G:><2/.21*4-@RRD6>6A7-80>3>>R-2R8?<21G2>8;:.175E1>?:.&04=>.&+'628=RL268'256,/7450&5).;34B@,%'2/76,:;1)6(0/8247-9'+&7:68>,)+(@&)&16+&&3-:11:/&;)0$
@gnl|ti|2267696790_CCZB9998/1
TTTGGGGGGGCCGGCGCGGCCAACGAATGGTCTAGAAGCTTCTCGAGGGCCGAGGCGGCCTTTTTTTTTTTTTTTTTTTTTTCCTGAAAACTTGTTTTATTACCTCATGAATTATCTTGAAAAGCAAATCCAAATTCATGATGGTGATATTAATCTTTAACCATGATAAAACATTCTGCAAAAAGTATCACTTTTTGATAATCCACTTGTTTGCTTTGCTTTCAGTGTTCCCCATTCACTATGCGAATCTTTTGTATTTTCATCGGGATGGGTTGAGACCAGAATAAATCGACACAGTTGTACAAAATTTTATGCATAAGTCTGAGGCGTAATTGCTTTTGTTCATTATATTTAGCTTTTATTTTCCCATTAGTTGTTTGTTTCACTCGGCTTGGGTTTTATTCCACAGGTACAAATGTTTTCAGACTTAAATATATTTTTGTTCATCAGGTACAAAAAATTTCCAGGAAGATATCTTGACTAATATTTCTAGTCAATAGAGATGGTTTCTTGAAGATATGATCATGTGTTTTTGGTGTCATGATGAAGTTTCTTTTTAACCAAGCCGCAAAGCTTTTTAAAACAAAAGGTTTATAGTTGACCGTAAGATTGGTGAGATGAGAGGAAAAGATGTCAGGATTTGTATTTGGGAAAGGATTAGGGAAGCACATTTTGTAAGGAATGATGAGAAAGATGATAAAATTAATTAGCGAGAGAGATAGAGGATAAAGTGCAATAGAAATGCCATTGGTGCAAGTTTTTTTTGATGAGTTGATAGGAAGGTACAGAATTGTTTAAATGCATAAAAATTGGCTGATTGGTACTTTAATTTTGTTCCTATTCCACCGAATGGAATGAGGTTGATTTTGGTTCCA
+
%(%&+'+('%'*,(+*+'&+,5;3I786X7.PPB,*((/P^^U^UJTN6)LND^8:^L8Z^^ZZ^^^^^^^^^^^^^^^^ZSTTLZQGGLIWW\MW\GR\L\WWJ=<E\\WWNNRNFJ\WWW\\W\\\\\\R\\\WREN\WN\RBNME\WN\WWWWM\\\\\\\\W\\\\\\\NWJGW\W\\\\\\W\WRR\Z\\\\\\\\\\\\\\\\W\W\WW\W\\Z\\LCGAWL\\\\\\\ZWM\\\\WWNWWRNMG\\\\\\\\Z\R\\\\\\\\ZS@CL@CRRQQGZTQSZZTZRRTCTLRSZZZZZZZZSS^ZZZUSZTZZZALLQQZQTQQETQQZQZZZZZNQTQQQZZZZQZZQQZZZZTZZZZZZZMGZLIDLTPLZTPLZZLLLTZLJLZRUZXMR^LUUNTL8MRTTTHXCPMPLITTTPFGTTTFLTMTPTTUT^XTNLML@TTTDG@TMDTTTTPXUTTF:TTUTPUCALMLLUPRRTX@RXLTMLHUPRERT^PURPH^I2UTTXRPIUCN@TXUMIP:GM>XTMLARU?-^FR>CLC:@HP?JPGLDXXTHJCH<,7+?D@840LF@RRXXGBUTL4+TUUUH>JHGRAHUP=T:UGFITIP4P=24HI=I<@P@OOTOXXXBP=:8@@7>7DA<@=@8XU>PFJTME.2=>NJT@?>8@0=4MPPAP=?B@1:@>>A?P<5<NA3A3>>>ENM6<;*7:;6=G3>9>9=6=9>=>58E/ER?30?847>G@HR1=;8>3A=6M:;70792RRMMNNA>64384896108.8-:/=16E051:&,E/N7>R&'543;CRIN<(0>F/7==087A(A41E>*8)<</&(/CA3<8=*&&24/.;)7&)0''/,%)-152ED*5)%)0&$
@gnl|ti|2267696792_CCZB9999/1
TTCGGGGGCCCGCGCCGGCCAACGAATGGTCTAGAAGCTTCTCGAGGGCCGAGGCGGCCTTTTTTTTTTTTTTTTTTTTCATCTCAATGAATAACTTTTATTGATTTACGTCAAGTTTTGATCTGTACACACAATCCTGCCACTTTCGTGAAGGACAAAATTGCTGATATATAGTATTATATATTATTTGCACTTAGATTGTACAATTTGATATAATTTCATAATTTATGCAATAATGCATTGGTTGTACAATTTAGCATAAGTTAGAATAAATGTCTTTCTTTTGAGGATACTCGATTAATTTAGATTCAGGGAAATGAAGAACGGACGATATTCCATGAGCCTTGGCACATACTTTTTGATACTTGTTTTAAGTCAATAAAGAAAACTTGTTCGTCAATGTTCACCATTGAAAGAAAATAGTAAATTTTGCAGAGAAATTAAATTCAGCATTCAAATATCAAAAAGAAAAGCTCAAAAATATAACAGCAAATTAAATTAATTTGTTAACTAATCTACAAAACAATCTCGATTAATACTTTAAATAGCTGAAAAACTGGACAAAACATATTGAATTCAAAGGGAAATCAACTTCTTTTGAATCCGATGAACTGAGGAAGTAACATTTTCATTCGGATACCGGGCAAGTGAAGTAAGTTTTTCTTTCAGAATCTCGATCGATTGGACACCAAATATTCCTGTGTATAGAGTTTCTGGAGATGCAACCTTGTTAATTGTTGGCAAATTTTGATGTCTAATGTTTCGCCTGAAAACAGCTTCCACTAGATTGCAAATAAAGGGAACACAAGGCGAATCAAAATTTTCTTTCGTCAGTCGGTTGGCTTCAATAAAGCTAATGAAAAATTGGCTGGA
+
$%%(&'(')''++())+&=+4;6G2*4X2&RGC*+(),M^^UXLA^^>/NJDNC>UH@R^^^^^^^^^^^^^^^^Z^ZZ;,QQLB<DZZZZZZ\Z\\\\\\\\\\\\\\\\RRW\W\\\\\\\\\RR\N\NLNWZ\\\\ZNW\\\WWWEWWR\\\W\\^\\\\\\ZZW\\\ZSZW\\WWZLW\\L\\\\\WM\\\\\\\W\\\\R\\\\\\\\\^^^^\\\\\\\\\\\\\\\\\\\\\\\\\\\\^\\^\\\^^^\\\\ZZZTIQQZSTZZSSUSZZTZTTTZZZZZ^SSQSZZTUZU^^U^UUZ^UZUQZ^Z^^UQZZTQZZQ^ZUUZ^TUQZ^UGZMZMZZZT^UZZZTZZ^^^ZZTUUTTTRT^TTUTUUUT^T^U^^TLUTTNTPT^UUXNTUMMTURTPA^NKU^TTTTTPTTLGTPTXXR^^^RIUTT^K^^;EUUNRTTNERRMU^NERNRT^URPRMMPTUMRRPUGGRR^ITTUIRRPTTRPUP>LUTX6GLPUPTC7IHUPXURTTXR@XRRMRMUUTTPPF6UTCXUTXIRRURJUMTAMUUTTIIJIAMIXTUA?PDIPJ8DPIB5XAGXOPXIIT>>POOH@XXPU@FCDA:H>IMHA@O@MTANC?@@E9PTPB90AAB;E...@95.ANTN>=?@=EG>==D>N>RMM<>MTGC2%JA>GE><=;=E@47;B0:7;G-MN>B>803;T>84>>>E;;,M97579?797??.;=I?J?-1??>=?7;@:1AL>2RR=>93J<GC:@/F?R:>53F>D;RN;1*:C=&3515970:*:540N@:)G5&9(B*,'/1(&),&5>6=6@R@5RR04.B)7,***@&>55>3B=.+&+&;<?C(*95')-6>BD;-28-)@-.,(

Sanger_EST_reads_to_be_filtered_from_Sanger_bam.txt

Martin Asser Hansen

unread,
Jun 21, 2016, 3:18:33 PM6/21/16
to biop...@googlegroups.com
Remove the @ from the ids in your list. The @ is not part of the FASTQ id.

Cheers,


Martin

--
You received this message because you are subscribed to the Google Groups "biopieces" group.
To unsubscribe from this group and stop receiving emails from it, send an email to biopieces+...@googlegroups.com.
For more options, visit https://groups.google.com/d/optout.

Wannes Dermauw

unread,
Jun 21, 2016, 4:03:39 PM6/21/16
to biopieces
Thank you for the quick reply!
It worked

Op dinsdag 21 juni 2016 21:18:33 UTC+2 schreef maasha:
Reply all
Reply to author
Forward
0 new messages