Re: [問題] 請問若想取出句子中的前後幾個字的話?

看板Perl作者 (成就你的大事)時間17年前 (2007/03/20 22:33), 編輯推噓2(201)
留言3則, 2人參與, 最新討論串3/4 (看更多)
就是一個句子中可能會有多個<PTN>存在 因此我想找出在兩個<PTN>之間的句子,前提條件是需要滿足 interaction,interactions,interacts 這3個字的其中一個字的話 就取出由<PTN>前後所組成的這個句子(所以是指以<PTN>做為起始 但有可能會出現的情況是  句子中有出現interaction,interactions,interacts 這3個字的其中一個字 可是情況一是 只有在上述的字中的左邊出現多個<PTN>,因此我想取出 由interaction,interactions,interacts中的字往左比對,直到找到包含兩個<PTN>為止 但有可能左邊也沒有任何<PTN>出現,因此就取到最左邊遇到.,;\s或句首為止。 情況二如上 只是左邊改成右邊,然後往右比對,直到找到兩個<PTN>為止,若找不到   任何的<PTN>則往右比對,直到遇到.,;\s或句尾為止。 即我都希望是最小的比對,而不是最大的比對(貪婪?) 再次感謝 麻煩了@@ ※ 引述《Yaowei (成就你的大事)》之銘言: : orz那我重新解釋一下好了= =順便改一下題目好了= =僅取出句含<PTN>之間的句子 : 就是希望找出句子中以interaction,interactions,interacts這三個字的其中之一 : 當作主軸中心,然後往外(左右兩旁延伸出去), : 規則是:所以我只想取出句含兩個<PTN>之中的句子 <PTN> .* <PTN> <-- 第一句 : 若在左方或右方找不到任何<PTN>則往右邊做比對<PTN>的動作<--第二句的結果 : 同樣也是取出包含兩個<PTN>的句子<---第三句 : 所以如果改成以上的條件的話,則是不是需要寫成兩個判斷式來判斷即可 : 即 if(/<PTN>\s.*?(interaction|interactions|interacts)\s<PTN>/){ : print $&; : } : elsif(/\s(interaction|interactions|interacts)\s.*?<PTN>.*?<PTN>/){ : } : 只是我希望可以看看能不能只寫成一個句子而已,且最多只出現2個<PTN>而已 : 然後在if(/<PTN>\s.*?(interaction|interactions|interacts)\s<PTN>/) : 的這句常規表示式中因為有可能前或後面(左/右邊)不會出現<PTN> : 的標記所以就需透過另一個常規式來擷取出所要的句子 : 因此,是不是需要將elsif的句子改成 : (/(<PTN>.*?<PTN>\s)?\s(interaction|interactions|interacts)\s(.*?<PTN>.*?<PTN>)/) : -->是否可以將此常規表示式搭配elsif的條件而整合成一個式子而已 : 謝謝大家囉^^表達的不好 若有疑問 歡迎補充^^ : : 若我想找出有符合下列樣版中的字 : : interaction,interactions,interacts : : 並由它們其中之一個取出如下的內容: : : 往前或後後推直到找到前後各有一個<PTN> 的兩個字,若前/後無<PTN>則往另一方向取出 : : 兩個<PTN>為止,若往前時是句首則停止,若往後的第二個字是.則也是停止。 : : 請問該如何作呢? : : ---------------------------------------------------------------------------- : : 比對到:interaction : : <PTN> mRNA coimmunoprecipitated with <PTN> in resting synaptoneurosomes, but : : the interaction was lost shortly after <PTN> treatment. : : --------------------------------------------------------------------------- : : 比對到:interactions : : Our data suggest that physical interactions between <PTN> and <PTN> mRNA : : underlie translational repression, : : ---------------------------------------------------------------------------- : : 比對到:interacts : : 來源: : : <PTN> interacts with <PTN> RNA as well as a number of <PTN>, : : ---------------------------------------------------------------------------- : : 目前的想法是不是需要在讀檔的時候,加入不同的條件式來判= = : : 那如果是樣子做的法,那麼不就需要寫很多if或者是case之類的判斷 : : 且若用常規表示式來寫的話,則好像不能只用一個就解決??? : : 有其它人有更好更方便的方法嗎?可以一起討論或分享心得嗎?:) : : 感謝你^^ -- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.142.234

03/21 12:52, , 1F
那有沒有前後都沒有<PTN>的情況呢?
03/21 12:52, 1F

03/21 12:52, , 2F
另我覺得用split('<PTN>', ...)應該就辦得到了
03/21 12:52, 2F

03/21 19:10, , 3F
一定會有<PTN>,且句子中一定會出現interact那幾個字@@
03/21 19:10, 3F
文章代碼(AID): #15__2XVY (Perl)
討論串 (同標題文章)
文章代碼(AID): #15__2XVY (Perl)