C# Net 比較2個字符串的相似度(使用余弦相似度)
當(dāng)前位置:點晴教程→知識管理交流
→『 技術(shù)文檔交流 』
本文章向大家介紹C#.Net 比較2個字符串的相似度(使用余弦相似度),主要包括C#.Net 比較2個字符串的相似度(使用余弦相似度)使用實例、應(yīng)用技巧、基本知識點總結(jié)和需要注意事項,具有一定的參考價值,需要的朋友可以參考一下。 /// <summary> /// 比較2個字符串的相似度(使用余弦相似度) /// </summary> /// <param name="str1"></param> /// <param name="str2"></param> /// <returns>0-1之間的數(shù)</returns> public static double SimilarityCos(string str1, string str2) { str1 = str1.Trim(); str2 = str2.Trim(); if (string.IsNullOrEmpty(str1) || string.IsNullOrEmpty(str2)) return 0; List<string> lstr1 = SimpParticiple(str1); List<string> lstr2 = SimpParticiple(str2); //求并集 var strunion = lstr1.union(lstr2); //求向量 List<int> int1 = new List<int>(); List<int> int2 = new List<int>(); foreach (var item in strunion) { int1.Add(lstr1.Count(o => o == item)); int2.Add(lstr2.Count(o => o == item)); } double s = 0; double den1 = 0; double den2 = 0; for (int i = 0; i < int1.Count(); i++) { //求分子 s += int1[i] * int2[i]; //求分母(1) den1 += Math.Pow(int1[i], 2); //求分母(2) den2 += Math.Pow(int2[i], 2); } return s / (Math.Sqrt(den1) * Math.Sqrt(den2)); }
/// <summary> /// 簡單分詞(需要更好的效果,需要這里優(yōu)化,比如把:【今天天氣很好】,分成【今天,天氣,很好】,同時可以做同義詞優(yōu)化,【今天】=【今日】效果更好) /// </summary> public static List<string> SimpParticiple(string str) { List<string> vs = new List<string>(); foreach (var item in str) { vs.Add(item.ToString()); } return vs; } 該文章在 2023/3/22 17:51:57 編輯過 |
關(guān)鍵字查詢
相關(guān)文章
正在查詢... |