AI操作
提供了目标检测、OCR、姿态识别和翻译等功能。(注意目前版本只有目标检测和ocr支持directml加速)
ssf.ai
文字识别返回值结构定义
属性名 | 类型 | 描述 |
---|---|---|
id | number | 唯一标识符 |
x | number | 区域左上角的X坐标 |
y | number | 区域左上角的Y坐标 |
w | number | 区域宽度 |
h | number | 区域高度 |
text | String | 识别出的文字 |
Example:
const result: ssf.ai.OCR_Result = { id: 1, x: 100, y: 200, w: 150, h: 50, text: "Hello World" };
目标检测返回值结构定义
属性名 | 类型 | 描述 |
---|---|---|
score | number | 检测置信度 |
x | number | 区域左上角的X坐标 |
y | number | 区域左上角的Y坐标 |
w | number | 区域宽度 |
h | number | 区域高度 |
label | String | 检测标签 |
Example:
const detection: ssf.ai.DetectionResult = { score: 0.95, x: 50, y: 100, w: 200, h: 100, label: "person" };
姿态检测 模块
-
init_model: 初始化姿态识别模型。
- 参数:
is_cpu
: boolean - 是否使用CPU。model_path
: String | null | undefined - 模型路径。which
: String - 模型类型。
- 示例:
ssf.ai.Pose.init_model(true, "./models/pose", "resnet");
- 参数:
-
parse: 对图像进行姿态解析。
- 参数:
img
: ssf.Image - 输入图像。confidence_threshold
: number - 置信度阈值。nms_threshold
: number - NMS阈值。mask_threshold
: number - 掩码阈值。is_draw
: boolean - 是否绘制结果。
- 示例:
const parsedPose = ssf.ai.Pose.parse(image, 0.5, 0.4, 0.6, true);
- 参数:
翻译 模块
-
init_model: 初始化翻译模型。
- 参数:
tokenizer_path
: String - 分词器路径。tokenizer_dec_path
: String - 解码器路径。model_path
: String - 模型路径。
- 示例:
ssf.ai.Translate.init_model("./models/tokenizer", "./models/tokenizer_dec", "./models/translate");
- 参数:
-
parse: 执行文本翻译。
- 参数:
text
: String - 待翻译文本。
- 返回值:
- String - 翻译后的文本。
- 示例:
const translatedText = ssf.ai.Translate.parse("你好世界");
- 参数:
文字识别 模块
-
init_model: 初始化OCR模型。
- 参数:
dir
: String - 模型目录。
- 示例:
ssf.ai.OCR.init_model("./models/ocr");
- 参数:
-
parse: 对图像执行OCR识别。
- 参数:
image
: ssf.Image - 输入图像。
- 返回值:
- OCR_Result[] - 识别结果数组。
- 示例:
const ocrResults = ssf.ai.OCR.parse(image);
- 参数: