本文目錄一覽:
PYTHON如何調取OCR識別模塊識別發票並輸出到EXCLE?
import qqai
from os import path
from win32com.client import Dispatch
import os
from datetime import datetime
def file_path():
global path_this_file
path_this_file = path.abspath(‘.’) + “\\”
global path_excel
path_excel = path_this_file + ‘信息導出.xlsx’
global path_pic_file
path_pic_file = path_this_file + ‘照片’
def get_pic_name():
pic_list = []
for pic in os.listdir(path_pic_file):
pic_path = path_pic_file + ‘\\’ + pic
pic_list.append(pic_path)
return pic_list
def HandwritingOCRImage(filename):
robot = qqai.vision.ocr.HandwritingOCR(app_id, app_key)
useless_list = [‘登記表’]
value_list = []
with open(filename, ‘rb’) as image_file:
result = robot.run(image_file)
item_list = result[‘data’][‘item_list’]
for value in item_list:
words= value[‘itemstring’]
if words in useless_list:
continue
else:
value_list.append(words)
return value_list
def get_useful_list(value_list):
key_list = [‘姓名’, ‘性別’, ‘出生日期’, ‘國家/地區’, ‘民族’, ‘職業’, ‘手機號碼’, ‘固定電話’, ‘證件類型’, ‘證件有效期限’, ‘證件號碼’, ‘通訊地址’, ‘郵編’]
useful_list = []
for words in value_list:
if words in key_list:
key_index = value_list.index(words)
next_index = key_index + 1
if value_list[next_index] in key_list:
useful_list.append(”)
else:
if words == ‘證件號碼’:
ID_NUM = “‘” + str(value_list[next_index]) #這邊是為了避免科學計數法的問題
useful_list.append(ID_NUM)
else:
useful_list.append(value_list[next_index])
else:
continue
return useful_list
def put_into_excel(useful_list):
xl = Dispatch(“Excel.Application”)
xl.Visible = False # True是顯示, False是隱藏
xl.DisplayAlerts = 0
excel_input = xl.Workbooks.Open(path_excel)
sheet = excel_input.Sheets(‘Sheet1’)
max_row = sheet.UsedRange.Rows.Count
values = len(useful_list)
for i in range(values):
sheet.Cells(max_row + 1, i + 1).Value = str(useful_list[i])
excel_input.Save()
excel_input.Close()
xl.quit()
starttime = datetime.now()
“””騰訊AI開放平台 圖片識別”””
app_id = ‘2110179251’
app_key = ‘******’
“””app_id , app_key 可以自己去騰訊AI開放平台註冊,是免費的”””
file_path()
pic_list = get_pic_name()
for filename in pic_list:
value_list =HandwritingOCRImage(filename)
useful_list = get_useful_list(value_list)
put_into_excel(useful_list)
endtime = datetime.now()
total_time = (endtime – starttime).seconds
print(“成功錄入信息{}條,總共耗時{}秒!”.format(len(pic_list),total_time))
怎麼生成二維碼,支持開發票掃描
可以安裝一個掃碼通開票軟件,配合一個小票打印機就能實現讓客戶自己掃描二維碼開具發票。
安裝好的軟件先維護好系統信息,當客戶消費完之後,商家只需在系統中輸入消費經額,點擊打印,就能打印出一張帶有二維碼的小票,商家只需將小票交給客戶,客戶利用自己微信或是支付寶掃一掃,填入自己的名稱和稅號,就可以自己完成掃碼開具發票。開具的發票也會自動保存到客戶的微信卡包里或者支付寶卡包里,對於商家和客戶都非常便利。
python提取發票信息發票識別
自己寫嗎?有點麻煩;開發成本很高,而且接口也不好找。我們公司也有IT團隊,本來想着自己開發,後來一算划不來。現在用的費耘發票系統,都是成熟模塊,直接集成在公司OA上,現在人員報銷自己錄發票,手機掃一下信息就錄到系統中,我們財務賬號這邊就能體現完整的台賬信息還有電子發票原件,非常方便。
怎麼掃描增值稅發票?
1、掃描操作:連接好掃描儀,點擊認證系統,進去後點擊發票錄入,然後打開掃描儀的蓋子,把需要認證的發票扣在掃描儀的最下面(背面向上),同時注意發票扣在最下面也要注意發票的方向,應該是發票的抬頭在朝向掃描儀的最下面邊框。放好發票後即點擊掃描錄入。即生成一個待認證的信,然後逐張掃描。都完成後,退出發票錄入,點擊上傳稅務認證,然後等待認證結果,大概過幾分鐘即可點擊接收認證結果。
大概有些需要注意的,掃描時候發票的方向正確很重要,接收認證結果後,如有沒有通過認證的發票,最好手工更改錯誤信息,因為只能上傳兩次,超過2次就要拿發票去稅務認證了。另外認證的時間最好不要在月底那天,最好可以提前。月底系統認證時間比較長,而且出問題也沒有太多時間更改。接收認證結果後,要等到月初時候才可以打印出文字的認知通知書來,月底前打印出來的是亂碼,只要看認證結果正確即可。
2、你補充的問題還沒有遇到過,不能幫你。
以上小弟拙見,希望對你有幫助!
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/237722.html