C# 中如何判断字符串的相似度
|
admin
2023年3月22日 17:12
本文热度 1552
|
基于 F23.StringSimilarity.dll 组件,Github 上可以搜索到该组件。
核心方法:
var l = new Levenshtein();
double tempValue = l.Distance("我是中国人", "我是中国人。");
下面是我扩展的方法,从一个集合中找到与目标字符串最相似的一个或多个字符串。
比如:["我是中国人", "我是美国人", "我的中国心", "我是中国通"] ,现在要找到 和 “我是中国” 最接近的字符串(可能有多个)。
如果用我下面的扩展方法。返回值
SimilarityValue = 1, SimilarityTargetList = ["我是中国人", "我是中国通"]
有需要的请拿走,不谢。
using F23.StringSimilarity;
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using System.Threading.Tasks;
namespace Demo
{
public class SimilarityResultInfo<TSource>
{
public double SimilarityValue { get; set; }
public IEnumerable<TSource> SimilarityTargetList { get; set; }
}
public static class EnumerableMethodSimilarityExtension
{
public static SimilarityResultInfo<string> Similarity(this IEnumerable<string> source, string targetText)
{
return Similarity<string>(source, c => c, targetText);
}
public static SimilarityResultInfo<TSource> Similarity<TSource>(this IEnumerable<TSource> source, Func<TSource, string> textselector, string targetText)
{
if (source == null)
{
throw new ArgumentNullException("source");
}
if (textselector == null)
{
throw new ArgumentNullException("textselector");
}
var l = new Levenshtein();
double? minStringSimilarityValue = null;
List<TSource> similarityTargetList = null;
foreach (var item in source)
{
string elementTextValue = textselector(item);
if (string.IsNullOrEmpty(elementTextValue))
{
continue;
}
double tempValue = l.Distance(elementTextValue, targetText);
if (!minStringSimilarityValue.HasValue)
{
minStringSimilarityValue = tempValue;
similarityTargetList = new List<TSource>() { item };
continue;
}
if (tempValue < minStringSimilarityValue.Value)
{
minStringSimilarityValue = tempValue;
similarityTargetList.Clear();
similarityTargetList.Add(item);
continue;
}
if (tempValue == minStringSimilarityValue.Value)
{
similarityTargetList.Add(item);
continue;
}
}
if (!minStringSimilarityValue.HasValue)
{
return null;
}
SimilarityResultInfo<TSource> result = new SimilarityResultInfo<TSource>();
result.SimilarityValue = minStringSimilarityValue.Value;
result.SimilarityTargetList = similarityTargetList;
return result;
}
}
}
谢谢浏览!
该文章在 2025/2/24 14:46:40 编辑过