chroma新增、删除、知识库应用
You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

129 lines
6.7 KiB

  1. #coding:utf8
  2. import re
  3. def get_data(inputdata):
  4. """
  5. 重新组装参数
  6. :param inputdata:原json数据
  7. :return: 组装的prompt及其他参数
  8. """
  9. res={}
  10. return res
  11. def get_content(inputdata,logging):
  12. """
  13. 重新组装参数
  14. :param inputdata:原json数据
  15. :return: 组装的prompt及其他参数
  16. """
  17. res={}
  18. admin=inputdata["metadata"]["admin"]
  19. data=inputdata["data"]
  20. prompt=admin["prompt"]
  21. if_user=re.findall("{{(.*)}}",prompt)
  22. if_data=re.findall("@@(.*)@@",prompt)
  23. if if_user != []:
  24. user_data=inputdata["metadata"]["user"]
  25. if if_user[0] in user_data.keys():
  26. tmp=user_data[if_user[0]]
  27. prompt=re.sub("{{(.*)}}",tmp,prompt)
  28. if if_data!=[] and if_data[0] in data.keys():
  29. tmp1=data[if_data[0]]
  30. prompt=re.sub("@@(.*)@@",tmp1,prompt)
  31. res["prompt"]=prompt
  32. res["authorization"]=admin["authorization"]
  33. res["model"]=admin["model"]
  34. res["temperature"]=admin["temperature"]
  35. res["authorization"]=admin["authorization"]
  36. res["top_p"]=admin["top_p"]
  37. res["n"]=admin["n"]
  38. return res
  39. if __name__=="__main__":
  40. inputdata={
  41. "metadata":{
  42. "output":{
  43. "output_type":"table",
  44. "label_col":[
  45. "软件著作抽取结果"
  46. ]
  47. },
  48. "input":{
  49. "input_type":"text",
  50. "label":[
  51. "7_软件著作过滤器"
  52. ]
  53. },
  54. "address":"http://172.18.1.181:9011/chatGpt/",
  55. "admin":{
  56. "authorization":"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",
  57. "top_p":"1",
  58. "user_input":[
  59. {
  60. "keyname":"tag",
  61. "keydesc":""
  62. }
  63. ],
  64. "temperature":"0.2",
  65. "model":"gpt-3.5-turbo-16k",
  66. "prompt":"请在下面这句话中提取出:证书号、软件名称、著作权人,以json格式输出,找不到的字段赋值为空字符串,不要有多余的文字输出,只输出json结构。@@7_软件著作过滤器@@",
  67. "n":"1"
  68. },
  69. "index":1
  70. },
  71. "data":{
  72. "1_项目文件上传":"[{ \"fileUrl\":\"http://172.18.1.130:9985/group33/default/20230816/16/05/1/1-基于时间序列遥感 影像洪涝检测系统.jpg\",\"fileType\":\"jpg\", \"filePath\":\"/软件著作/1-基于时间序列遥感 影像洪涝检测系统.jpg\",\"fileId\":\"cd6592f0389bb1da25afbb44901f9cde\",\"fileName\":\"1-基于时间序列遥感 影像洪涝检测系统.jpg\" },{ \"fileUrl\":\"http://172.18.1.130:9985/group33/default/20230816/16/06/1/2-基于遥感影像的快速变化检测系统.jpg\",\"fileType\":\"jpg\", \"filePath\":\"/软件著作/2-基于遥感影像的快速变化检测系统.jpg\",\"fileId\":\"338847e34904fa96e8834cb220667db8\",\"fileName\":\"2-基于遥感影像的快速变化检测系统.jpg\" },{ \"fileUrl\":\"http://172.18.1.130:9985/group33/default/20230816/16/08/1/3-基于时空模型的遥感时间序列森林火灾检测系统.jpg\",\"fileType\":\"jpg\", \"filePath\":\"/软件著作/1/3-基于时空模型的遥感时间序列森林火灾检测系统.jpg\",\"fileId\":\"944eec1cf98f216ea953459dac4dd505\",\"fileName\":\"3-基于时空模型的遥感时间序列森林火灾检测系统.jpg\" },{ \"fileUrl\":\"http://172.18.1.130:9985/group33/default/20230816/16/09/1/4-基于隐马尔可夫模型的遥感时间序列分类系统.jpg\",\"fileType\":\"jpg\", \"filePath\":\"/软件著作/4-基于隐马尔可夫模型的遥感时间序列分类系统.jpg\",\"fileId\":\"eb378cb9ee914323f601500378dfad76\",\"fileName\":\"4-基于隐马尔可夫模型的遥感时间序列分类系统.jpg\" }]",
  73. "2_文件分类信息":"{\"软件著作\":4}",
  74. "3_OCR识别内容":"{\"content\":\" 22222222222222222222222222222222222222222222222222\\n中华人民共和国国家版权局\\n计算机软件著作权登记证书\\n证书号:软著登字第1623261号\\n软件名称:\\n基于遥感影像的快速变化检测系统\\nV1.0\\n著作权人:中国科学院遥感与数字地球研究所\\n开发完成日期:2016年08月01日\\n首次发表日期:未发表\\n权利取得方式:原始取得\\n权利范围:全部权利\\n登记号:2017SR037977\\n根据《计算机软件保护条例》和《计算机软件著作权登记办法》的\\n规定,经中国版权保护中心审核,对以上事项予以登记\\n计算机软件著作权\\n登记专用章\\n2017年02月10日\\nNo.01433672\",\"fileId\":\"338847e34904fa96e8834cb220667db8\",\"fileName\":\"2-基于遥感影像的快速变化检测系统.jpg\",\"filePath\":\"/软件著作/2-基于遥感影像的快速变化检测系统.jpg\",\"fileType\":\"jpg\",\"fileUrl\":\"http://172.18.1.130:9985/group33/default/20230816/16/06/1/2-基于遥感影像的快速变化检测系统.jpg\",\"pageNum\":1}",
  75. "businessKey":"185aef3b1c810799a6be8314abf6512c",
  76. "7_软件著作过滤器":"{\"content\":\" 22222222222222222222222222222222222222222222222222\\n中华人民共和国国家版权局\\n计算机软件著作权登记证书\\n证书号:软著登字第1623261号\\n软件名称:\\n基于遥感影像的快速变化检测系统\\nV1.0\\n著作权人:中国科学院遥感与数字地球研究所\\n开发完成日期:2016年08月01日\\n首次发表日期:未发表\\n权利取得方式:原始取得\\n权利范围:全部权利\\n登记号:2017SR037977\\n根据《计算机软件保护条例》和《计算机软件著作权登记办法》的\\n规定,经中国版权保护中心审核,对以上事项予以登记\\n计算机软件著作权\\n登记专用章\\n2017年02月10日\\nNo.01433672\",\"fileId\":\"338847e34904fa96e8834cb220667db8\",\"fileName\":\"2-基于遥感影像的快速变化检测系统.jpg\",\"filePath\":\"/软件著作/2-基于遥感影像的快速变化检测系统.jpg\",\"fileType\":\"jpg\",\"fileUrl\":\"http://172.18.1.130:9985/group33/default/20230816/16/06/1/2-基于遥感影像的快速变化检测系统.jpg\",\"pageNum\":1}"
  77. },
  78. "created":1691004265000,
  79. "module":"OCR",
  80. "start_tag":"false",
  81. "last_edit":1692464331000,
  82. "next_app_id":[
  83. {
  84. "start_id":86,
  85. "edge_id":49,
  86. "end_id":90
  87. }
  88. ],
  89. "transfer_id":11,
  90. "blueprint_id":3,
  91. "scenes_id":3,
  92. "scenario":{
  93. "dataloss":1,
  94. "autoCommitTriggerLast":1,
  95. "maxErrors":3,
  96. "autoCommit":1,
  97. "freshVariables":1
  98. },
  99. "wait_condition":[
  100. ],
  101. "scheduling":{
  102. "interval":-1,
  103. "type":"single"
  104. },
  105. "name":"软件著作抽取",
  106. "businessKey":"185aef3b1c810799a6be8314abf6512c",
  107. "id":86,
  108. "describe":"软件著作抽取"
  109. }
  110. a=get_content(inputdata,"")
  111. print(a)