百度AI系列课程 ==================================== 课程编写:谢作如 百度AI开放平台提供了各种应用,如语音识别、文字识别、智能对话、语音合成、人脸识别、图像识别等。通过百度AI,可以有效降低学习AI的门槛。 -------------------------- 课程简介 -------------------------- 这是一个基于百度AI开放平台开发的课程。虚谷号已经安装了百度AI的Python库,可以很方便地调用。使用这一系列课程,请确保 -------------------------- 准备工作 -------------------------- 1.安装必要的Python库。 如果你使用的是虚谷号,安装方法就可以略过。 https://github.com/gkvoelkl/ipython-turtle-widget 安装方法: pip install ipyturtle jupyter nbextension enable --py --sys-prefix ipyturtle 2.注册百度用户。 注册网址:https://ai.baidu.com 注册用户后,还要建立应用(任何一个应用,然后把可以选择的接口全部选上),得到API Key 和 Secret Key。请记下两个Key,在下面的Python代码中都会用到。 .. image:: ../images/10/10.2-baidu01.png .. image:: ../images/10/10.2-baidu02.png -------------------------- 课程目录 -------------------------- 课程精选了百度AI平台中部分典型应用,提供最简洁有趣的代码。 1.人脸识别 2.颜值和表情 3.车辆识别 4.车牌识别 5.文字识别 6.智能语音 打开虚谷号的jupyter服务,即可看到这些课程。 .. image:: ../images/10/10.2-baidu03.png -------------------------- 调用百度AI的一般过程 -------------------------- 我们可以把百度AI看成是一个无所不知的“智者”,只要你准确地提交问题,即可得到答案。百度AI的调用过程,大致可以分为三个步骤: 1.建立对象,设置用户参数,读取需要识别的对象信息。 这里的对象信息,可以是一张图片、一段文字,也可以是音频文件等等。 2.提交信息到百度AI平台,平台处理后,返回识别结果。 3.根据识别结果,执行相应的代码。 百度AI返回的是JSON类型的字符串,通过程序进行分析、提取。Python中可以用一个函数将其转换为字典。 -------------------------- 课程示例 -------------------------- 以“文字识别”为例。 第一步、导入库 :: # -*- coding: UTF-8 -*- from aip import AipOcr 第二步、设置认证信息 注:这里用的是测试账号,有访问次数的限制,请使用自己的账号信息。 :: """ 你的 APPID AK SK """ APP_ID = '15469649' API_KEY = '3vZgLINSnGGEafPflkTLzkGh' SECRET_KEY = '8cUXtkMed2z86kqfyrV606ylnCmfcc48' 第三步、初始化AipFace对象 :: aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY) 第四步、读取图片 :: filePath = "word.jpg" def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() ​ 第五步、定义参数变量 :: options = {'detect_direction': 'true','language_type': 'CHN_ENG',} 第六步、调用通用文字识别接口 :: result = aipOcr.basicGeneral(get_file_content(filePath), options) print(result) words_result=result['words_result'] for i in range(len(words_result)): print(words_result[i]['words'])