一、什麼是yumdig?
Yumdig是一個面向電商業務場景的多模態數據標註工具,它的主要特點是支持多種數據類型的標註,包括文本、圖片、音頻等,同時支持標註團隊協同工作,提供標註任務分配、質量管控等功能。
從技術角度來看,yumdig採用前後端分離的架構,前端採用React開發,後端採用Python Flask框架實現,同時採用Redis作為緩存層、MySQL作為數據存儲層。
二、yumdig的特點有哪些?
1、支持多種數據類型的標註
yumdig支持文本、圖片、音頻等多種數據類型的標註,可以滿足各種不同業務場景下的標註需求。
2、支持標註團隊協同工作
yumdig提供了豐富的標註任務分配、質量管控等功能,可以有效提高標註團隊的協同效率。
3、可擴展性強
yumdig採用前後端分離的架構,可以方便地擴展新的數據類型、標註任務等功能。
4、安全性高
yumdig採用Redis作為緩存層、MySQL作為數據存儲層,同時採用了多種安全保護措施,保障用戶數據的安全性。
三、yumdig的使用示例
1、創建標註任務
可以通過yumdig的後台管理系統創建新的標註任務,設置任務名稱、任務描述、數據類型、標註類型、標註員數量等信息。
task = Task(name="商品評論標註", desc="標註商品評論情感極性", data_type="text",
annotation_type="tagging", status="created", creator="admin", annotator_count=5)
db.session.add(task)
db.session.commit()
2、分配標註任務
可以通過yumdig的後台管理系統,將已創建的標註任務分配給標註員,同時可以設置標註員的工作時長、報酬等信息。
annotations = Annotation.query.filter_by(status="created").all()
for annotator in annotators:
for annotation in annotations:
task_assignment = TaskAssignment(task_id=annotation.task_id, annotator_id=annotator.id, data_id=annotation.id,
status="assigned", assign_time=datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
db.session.add(task_assignment)
db.session.commit()
3、進行標註工作
標註員可以登錄yumdig的前端界面,進行相應的標註工作。
4、審核標註結果
可以通過yumdig的後台管理系統,對標註結果進行審核,保證標註結果的質量。
annotations = Annotation.query.filter_by(status="annotated").all()
for annotation in annotations:
results = AnnotationResult.query.filter_by(annotation_id=annotation.id).all()
tags = set([result.value for result in results])
if len(tags) != 1:
annotation.status = "re_annotation"
else:
annotation.status = "audited"
db.session.commit()
四、yumdig未來的發展方向
1、更豐富的標註功能
未來yumdig將支持更豐富的標註功能,包括視頻、語音識別、多輪對話等領域。
2、更加智能的標註質量管控
未來yumdig將引入機器學習算法,提高標註結果的質量,並且降低人工審核成本。
3、更加便捷的擴展性
未來yumdig將會提供更加便捷的擴展性,使得用戶可以方便地擴展新的數據類型、標註任務等功能。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/232079.html