[問題] 如何比對字串是否相似?

看板C_Sharp作者 (Orz)時間13年前 (2011/04/26 12:43), 編輯推噓1(101)
留言2則, 1人參與, 最新討論串1/2 (看更多)
this is a book. that is a bamboo while i was a child, i'd like to play baseball when i was young, i loved playing baseball 如上兩段話. 第一段2句話4個單字有兩個單字一樣,剩下一個單字有三個字母重複. 相似度超過50%, 第二段話,逗號前相似度是50%(wh, i was) 逗號後的相似度則是不到50%(i play baseball), 我目前需要寫的程式和這個有點像 可是我想不到有甚麼好方法可以去判斷兩個句子的相似度高不高. 不知道大家有沒有想法? 還是說一定要將兩個句子一個詞一個詞拆開, 然後互相去比對? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.169.228.6

02/28 01:30, , 1F
從句子長度或是間隔數(格) 也能比對長度,長度相差太多的
02/28 01:30, 1F

02/28 01:30, , 2F
也就代表相似程度越低,但對長度相仿的就比較沒效果
02/28 01:30, 2F
文章代碼(AID): #1Djas2UT (C_Sharp)
文章代碼(AID): #1Djas2UT (C_Sharp)