本项目旨在识别两组数据是否来自同一主体,同时它还是一个支持MCP(模型上下文协议)的服务器,为数据比较提供了强大的支持。
本项目提供了一个数据比较工具,能全面比较两组数据,评估其值的精确和语义相等性,借助文本规范化和语言模型来判断数据是否源自同一主体。
要使用此工具,请确保安装了必要的依赖项。您可以使用pip进行安装:
pip install genai
本工具提供了几个核心函数,下面是这些函数的介绍及使用示例:
import json
import genai
import re
# 定义您的JSON对象
json1 = {
"name": "John Doe",
"address": "123 Main St, Anytown, USA",
"hobbies": ["reading", "hiking", "coding"]
}
json2 = {
"name": "john doe",
"address": "123 Main Street, Anytown, USA",
"hobbies": ["coding", "hiking", "reading"]
}
# 比较JSON对象
comparison_results = compare_json(json1, json2)
# 生成最终匹配结果
model1 = genai.GenerativeModel("gemini-2.0-flash-thinking-exp")
result_matching = model1.generate_content("综合这些信息,你认为可以判断两个数据来自同一主体吗?"+json.dumps(comparison_results, ensure_ascii=False, indent=4))
print(result_matching.text)
normalize_text(text):
compare_values(val1, val2):
compare_json(json1, json2):
compare_values评估每个键的值。欢迎贡献!请打开问题或提交拉取请求。
该项目采用MIT许可证。有关详细信息,请参阅 LICENSE 文件。
如果您有任何问题或建议,请通过以下方式联系我:
微信