Re: [問題] 請問若想取出句子中的前後幾個字的話?
就是一個句子中可能會有多個<PTN>存在
因此我想找出在兩個<PTN>之間的句子,前提條件是需要滿足
interaction,interactions,interacts 這3個字的其中一個字的話
就取出由<PTN>前後所組成的這個句子(所以是指以<PTN>做為起始
但有可能會出現的情況是
句子中有出現interaction,interactions,interacts 這3個字的其中一個字
可是情況一是 只有在上述的字中的左邊出現多個<PTN>,因此我想取出
由interaction,interactions,interacts中的字往左比對,直到找到包含兩個<PTN>為止
但有可能左邊也沒有任何<PTN>出現,因此就取到最左邊遇到.,;\s或句首為止。
情況二如上 只是左邊改成右邊,然後往右比對,直到找到兩個<PTN>為止,若找不到
任何的<PTN>則往右比對,直到遇到.,;\s或句尾為止。
即我都希望是最小的比對,而不是最大的比對(貪婪?)
再次感謝 麻煩了@@
※ 引述《Yaowei (成就你的大事)》之銘言:
: orz那我重新解釋一下好了= =順便改一下題目好了= =僅取出句含<PTN>之間的句子
: 就是希望找出句子中以interaction,interactions,interacts這三個字的其中之一
: 當作主軸中心,然後往外(左右兩旁延伸出去),
: 規則是:所以我只想取出句含兩個<PTN>之中的句子 <PTN> .* <PTN> <-- 第一句
: 若在左方或右方找不到任何<PTN>則往右邊做比對<PTN>的動作<--第二句的結果
: 同樣也是取出包含兩個<PTN>的句子<---第三句
: 所以如果改成以上的條件的話,則是不是需要寫成兩個判斷式來判斷即可
: 即 if(/<PTN>\s.*?(interaction|interactions|interacts)\s<PTN>/){
: print $&;
: }
: elsif(/\s(interaction|interactions|interacts)\s.*?<PTN>.*?<PTN>/){
: }
: 只是我希望可以看看能不能只寫成一個句子而已,且最多只出現2個<PTN>而已
: 然後在if(/<PTN>\s.*?(interaction|interactions|interacts)\s<PTN>/)
: 的這句常規表示式中因為有可能前或後面(左/右邊)不會出現<PTN>
: 的標記所以就需透過另一個常規式來擷取出所要的句子
: 因此,是不是需要將elsif的句子改成
: (/(<PTN>.*?<PTN>\s)?\s(interaction|interactions|interacts)\s(.*?<PTN>.*?<PTN>)/)
: -->是否可以將此常規表示式搭配elsif的條件而整合成一個式子而已
: 謝謝大家囉^^表達的不好 若有疑問 歡迎補充^^
: : 若我想找出有符合下列樣版中的字
: : interaction,interactions,interacts
: : 並由它們其中之一個取出如下的內容:
: : 往前或後後推直到找到前後各有一個<PTN> 的兩個字,若前/後無<PTN>則往另一方向取出
: : 兩個<PTN>為止,若往前時是句首則停止,若往後的第二個字是.則也是停止。
: : 請問該如何作呢?
: : ----------------------------------------------------------------------------
: : 比對到:interaction
: : <PTN> mRNA coimmunoprecipitated with <PTN> in resting synaptoneurosomes, but
: : the interaction was lost shortly after <PTN> treatment.
: : ---------------------------------------------------------------------------
: : 比對到:interactions
: : Our data suggest that physical interactions between <PTN> and <PTN> mRNA
: : underlie translational repression,
: : ----------------------------------------------------------------------------
: : 比對到:interacts
: : 來源:
: : <PTN> interacts with <PTN> RNA as well as a number of <PTN>,
: : ----------------------------------------------------------------------------
: : 目前的想法是不是需要在讀檔的時候,加入不同的條件式來判= =
: : 那如果是樣子做的法,那麼不就需要寫很多if或者是case之類的判斷
: : 且若用常規表示式來寫的話,則好像不能只用一個就解決???
: : 有其它人有更好更方便的方法嗎?可以一起討論或分享心得嗎?:)
: : 感謝你^^
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.142.234
推
03/21 12:52, , 1F
03/21 12:52, 1F
→
03/21 12:52, , 2F
03/21 12:52, 2F
推
03/21 19:10, , 3F
03/21 19:10, 3F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 4 篇):