xref: /OK3568_Linux_fs/external/rknn-toolkit2/doc/changelog-1.5.0.txt (revision 4882a59341e53eb6f0b4789bf948001014eff981)
12023-5-18
2版本: v1.5.0:
3更新内容:
41. 更新config.dynamic_input的接口定义
52. 修复部分op属性获取失败的问题
6
72023-5-17
8版本: v1.4.6b2:
9更新内容:
101. 修复RK3562 多batch rknn模型C API运行错误的Bug。
11
122023-5-15
13版本: v1.4.6b1:
14更新内容:
151. 修复普通API多输入多输出模型动态shape出错的bug
162. 增加RK3562 Matmul API支持
173. 修复第一层为Reshape时dynamic_input失败的问题
184. 修复opset12~15可能存在的问题
19
202023-5-11
21版本: v1.4.6b0:
22更新内容:
231. 优化RKNN_FLAG_COLLECT_MODEL_INFO_ONLY初始化效率
242. 修复1x1x1x1两个feature Add算子转换Bug
253. 修复load_rknn加载老版本模型出错的兼容性问题
264. 添加opset13/14/15的部分支持 (试验性质)
275. 修复eval_perf导出csv时可能会报错的问题
286. 修复load_rknn报错问题
297. 添加非4维的ReduceXXX支持
30
312023-5-6
32版本: v1.4.5b3:
33更新内容:
341. 增加RKNN_MIN_TIMEOUT_MS环境变量设置NPU提交任务超时的阈值
352. 添加一维Where的支持
363. 修复大模型包含Constant节点报错的问题
374. 优化权重稀疏化的性能
38
392023-4-28
40版本: v1.4.5b2:
41更新内容:
421. 修复dynamic_input普通api结果错误问题
432. 修复非4维输入连板推理报错问题
44
452023-4-27
46版本: v1.4.5b1:
47更新内容:
481. 修复dynamic_input连板推理输出shape报错问题
492. 添加matmul前后transpose的消除规则, 并优化matmul性能
503. 修复大模型编译报错问题
514. 添加load_rknn的dynamic_input支持
525. 修复代码生产时resize出错的问题
53
542023-4-26
55版本: v1.4.5b0:
56更新内容:
571. [RK3562] 优化Transformer模型中的transpose/reshape多算子级联的性能
582. 增加后缀为.torchscript的pytorch文件格式支持
59
602023-4-25
61版本: v1.4.4b5:
62更新内容:
631. 修复dynamic_input在存在Reshape下的推理报错问题
642. 增加dynamic_input多轴动态支持
653. 更新cpp部署代码生成功能
66
672023-4-23
68版本: v1.4.4b3:
69更新内容:
701. 添加dynamic_input功能
712. 修复3维deconv报错问题
723. 更新大模型转换支持
734. 优化模拟器推理性能
745. 添加cpp部署代码生成功能
756. 修复load_rknn的推理问题
76
772023-4-14
78版本: v1.4.3b12:
79更新内容:
801. [RK3562]增加指定层跑CPU/GPU/NPU特性。
812. 修复concat优化规则
823. 添加op_target功能
83
842023-4-11
85版本: v1.4.3b10:
86更新内容:
871. 更新rknn编译器
88
892023-4-10
90版本: v1.4.3b9:
91更新内容:
921. 更新tensorflow QAT支持
932. 优化大模型的转换内存和性能
943. 修复图优化问题,并添加部分新规则
954. 修复mmse报错问题
965. 优化conv的拆分规则
976. 修复混合量化问题
987. 添加RMSNorm支持
998. load_onnx添加input_initial_val参数
1009. 修复onnxoptimizer报错问题
101
1022023-3-28
103版本: v1.4.3b4:
104更新内容:
1051. 修复5维slice的问题
106
1072023-3-27
108版本: v1.4.3b3:
109更新内容:
1101. [RK3566]优化CNN+LSTM结构模型的内存。
1112. 优化Concat性能
1123. load_tflite/load_tensorflow添加input_is_nchw参数
113
1142023-3-23
115版本: v1.4.3b2:
116更新内容:
1171. mul/add/div/sub算子优化。
1182. 修复多级maxpool量化问题
119
1202023-3-21
121版本: v1.4.3b1:
122更新内容:
1231. 修复Expand算子Bug
124
1252023-3-21
126版本: v1.4.3b0:
127更新内容:
1281. [RK3562]增加内部Buffer循环复用功能
1292. [RK3562]优化多batch layerNorm算子精度
1303. [RK3566]int8 Matmul CPU算子优化
1314. [全平台]expand NPU OP支持
1325. [全平台]fp16模型输入耗时优化
1336. 完善Cast算子的支持
1347. 修复remove_weight/多输入归一化参数匹配错误等Bug
1358. 更新常量折叠支持
1369. 更新eval_perf功能
13710. 增加float16模型的支持
13811. 优化常量共享的模型
139
1402023-3-9
141版本: v1.4.2b6:
142更新内容:
1431. RK3562平台Bug修复。
1442. 增加model_pruning控制,并支持deconv,以及Bug修复
1453. 增加If/Loop的部分转换支持
1464. 修复MMSE部分模型失败的问题
1475. 优化仿真器的结果
1486. 增加python3.10的支持
1497. 优化转换内存占用
1508. 增加部分非4维Op支持
151
1522023-2-15
153版本: v1.4.2b1:
154更新内容:
1551. 修复RK3562查询的size_with_stride大小错误问题
156
1572023-2-14
158版本: v1.4.2b0:
159更新内容:
1601. 更新neg支持
1612. 增加min/max的融合优化
1623. 增加了RK3562平台支持
163
1642023-2-8
165版本: v1.4.1b23:
166更新内容:
1671. 修复特定stride反卷积算子的Bug。
1682. 更新MatMul的perchannel量化支持
1693. 更新动态图检测功能
1704. 优化where的量化支持
171
1722023-2-2
173版本: v1.4.1b22:
174更新内容:
1751. 增加Equal算子对Bool类型支持。
1762. 修复Matmul算子/exLayerNorm算子的Bug.
1773. 更新equal/slice/cast/pad/ConvTranspose支持
1784. 更新QAT模型支持
1795. 移除bfloat16包依赖
180
1812023-1-13
182版本: v1.4.1b21:
183更新内容:
1841. 修复RK3588 Matmul接口错误。
1852. 修复4通道输入float16类型模型在RK356X平台查询虚宽错误问题。
1863. 模型不填写量化信息情况下,默认Tensor量化类型为float16。
1874. 增加unk__xxx无效shape支持
1885. 更新abs/dataconvert支持
1896. 优化模型剪枝功能
190
1912023-1-6
192版本: v1.4.1b19:
193更新内容:
1941. [功能]增加Conv+Add+Relu子图融合。
1952. 修复Conv+Add在量化参数不一致情况下融合的Bug。
1963. 修复RK3588 大kernel卷积的Bug。
1974. 增加模型剪枝功能
1985. 优化Sigmoid的量化参数
1996. 增加rk3562的支持
200
2012022-12-17
202版本: v1.4.1b17:
203更新内容:
2041. [优化]增加NPU输出NCHW数据支持。
2052. [功能]增加conv+add+relu融合支持。
2063. 修复最高维度非1模型MaxPool算子错误的Bug。
2074. 修复最高维度非1模型首层Conv错误的Bug。
2085. 修改4维npy的layout定义
2096. 优化dataconvert/gather/transpose/mul/maxpool/sigmoid/pad/conv/relu/softmax支持
2107. 增加aten::upsample_nearest2d支持
2118. 修复仿真器在perchannel下可能的溢出问题
2129. 增加更多的转换错误提示
21310. 更新混合量化支持
214
2152022-11-26
216版本: v1.4.1b14:
217更新内容:
2181. 修复寄存器位宽限制警告。
2192. 优化Concat CPU算子效率。
2203. 增加2维layernorm支持
2214. 更新MatMul支持
222
2232022-11-19
224版本: v1.4.1b13:
225更新内容:
2261. [重要]Android NDK编译器升级到r23b版本,APP建议使用该版本NDK重新编译。
2272. LSTM结构更新升级,需要重新转换模型。
2283. RK356X增加Transpose优化。
2294. RK356X模型非对齐通道的float类型NCHW输出效率优化。
2305. 增加常量输出节点删除功能
2316. MMSE支持无法batch扩维的模型
2327. 修复resize/clip缺失属性的问题
2338. 增加swish/dataconvert/softmax/lstm/layernorm相关优化
2349. 增加离群值检测功能
23510. 优化非4维OP的性能
236
2372022-11-01
238版本: v1.4.1b12:
239更新内容:
2401.修复LSTM模型多次转换结果不一致问题。
2412.改进onnx模型裁剪功能
242
2432022-10-29
244版本: v1.4.1b11:
245更新内容:
2461.修复Runtime外部分配内接口运行LSTM错误问题。
2472.修复Runtime rknn_dup_context接口运行LSTM错误问题。
2483.优化大模型转换性能
2494.添加Loop/Scatter转换支持
250
2512022-10-24
252版本: v1.4.1b10:
253更新内容:
2541.修复LSTM兼容性问题。
2552.修复RK3588输入自动填充虚宽值的重复运行错误的bug。
2563.修复出现size=0的中间tensor刷cache失败的问题(模型需重新生成)。
2574.增加IN、Swish非4维支持
2585.添加tflite支持perchannel的QAT模型
259
2602022-10-19
261版本: v1.4.1b9:
262更新内容:
2631.修复RV1106 rknn_detroy接口内存泄漏问题。
264
2652022-10-18
266版本: v1.4.1b8:
267更新内容:
2681.修复非LSTM模型共享权重时rknn_init失败的bug。
269
2702022-10-17
271版本: v1.4.1b7:
272更新内容:
2731.修复RK3588分支合并后的bug。
274
2752022-10-17
276版本: v1.4.1b6:
277更新内容:
2781.修复大分辨率输入的bug。
2792.优化无效pad
280
2812022-10-13
282版本: v1.4.1b5:
283更新内容:
2841.修复32-bit库matmul错误的bug。
2852.添加FAQ文档
2863.更新图优化规则
2874.调节MatMul量化方式
288
2892022-10-12
290版本: v1.4.1b4:
291更新内容:
2921.修复LSTM共享权重失败问题。
2932.更新图优化规则
294
2952022-10-10
296版本: v1.4.1b3:
297更新内容:
2981. LSTM寄存器配置内存占用的优化。
2992. 优化MMSE量化算法
3003. 优化KL量化算法
301
3022022-9-30
303版本: v1.4.1b2:
304更新内容:
3051. 关闭寄存器差量支持
3062. 增加Batchnorm+Relu融合支持
3073. 增加32-bit Runtime库Neon优化支持。
3084. 优化rknn_init空初始化性能。
3095. 更新精度分析功能
3106. 修复QAT模型的hardsigmoid等问题
3117. 修复lstm/gru图优化问题
3128. 更新图优化规则
313
3142022-9-14
315版本: v1.4.1b1:
316更新内容:
3171. 增加寄存器差量支持
3182. 修复lstm的bug
319
3202022-9-14
321版本: v1.4.1b0:
322更新内容:
3231. 增加rknn.config接口增加npu_do_output_nhwc配置,开启或关闭NPU直接输出NHWC的特性
3242. 修复QAT模型解析问题
325
326
327------------------------------------------------------------
3282022-8-20
329版本: v1.4.0:
330更新内容:
3311. 升级相关依赖包到主流版本
3322. 添加更多2/3/5维度的Op支持
3333. 更新config/init_runtime等接口
3344. 更新LSTM等Op支持
3355. 添加yuv输入支持
3366. 更新QAT模型支持
337
3382022-7-2
339版本: v1.3.4b5:
340更新内容:
3411. rknn-toolkit2:
342    1) optimize_onnx接口
343        a. 在设置optimization_level=2时,关闭conv+add融合。
344        b. 保留BatchNormalize算子带的量化参数。
345    2) RK3588屏蔽NPU直接输出NHWC layout的支持, RK3566/RV1106保留该功能。
3462.  C API:
347    1) RK3588/RK3566/RV1106支持传入一个包含rknn模型的大文件路径,rknn_init接口设置包含偏移和真实rknn模型大小的rknn_init_extend结构体指针。
348
349
350------------------------------------------------------------
3512021-4-22
352版本: v1.3.0:
353更新内容:
3541. 新功能: python3.8/ubuntu20.04 平台支持
3552. 修复一些已知的bug:
356    1) 修复了一些图优化和量化bug
357
3582021-4-7
359版本: v1.2.5:
360更新内容:
3611. 新功能: rv1103/rv1109平台的支持.
3622. 修复一些已知的bug:
363    1) 修复了一些QAT模型转换问题
364    2) 修复了一些图优化bug
365
366
3672021-1-27
368版本: v1.2.1-beta:
369更新内容:
3701. 新功能: 多batch的NHWC格式输入时,在H维度,有效元素个数与实际内存中的元素个数不一致时,支持H方向实际元素个数按照h_stride设置.
3712. 修复一些已知的bug:
372    1) LSTM算子内部变量重名的问题.
373
374
375------------------------------------------------------------
3762021-1-12
377版本:v1.2.0
378更新内容:
3791. 新功能: rk3588平台的支持; rknn模型加密支持; tensorflow/tflite/pytorch量化感知模型支持; 增加了一些新的 op 支持: InstanceNormalization, Swish, Conv1D等(详见 op support list);增加了参数量计算以及算力分析
3802. examples 更新:增加了从 pytorch 转 onnx 的转换 demo:resnet18_export_onnx ;增加了pytorch量化感知模型的加载demo:resnet18_qat demo;增加了模型加密功能:添加了3588平台 rknn 转换 demo
3813. 接口更改:移除了 config,load_caffe,load_tensorflow等接口的一些不必要的参数设置,更新了 eval_perf 接口,详细改动见Uer_Guide文档
3824. 修复一些已知的bug:
383    1) 修复了一些模型无法转换rknn的问题
384    2) 修复了一些图优化bug
385    3) 修复了一些模型推理结果错误的问题
386    4) 修复了 pytorch、tflite 某些 op 转换失败的问题
3875. 优化: 精度分析耗时优化; 模型转换和量化耗时优化
388
389
390------------------------------------------------------------
3912021-8-12
392版本:v1.1.0
393更新内容:
3941. 新功能: LSTM,GRU的支持;增加了accuracy_analysis对比项目;增加了一些op支持:caffe hardswish;onnx gather,reduceMax等op;更新了更全面的图优化规则。
3952. examples更新:增加了yolov5的demo
3963. 修复一些已知的bug:
397    1)修复了一些模拟器的推理结果错误问题
398    2)修复了一些图优化bug
399    3)修复了一些大模型无法转换rknn的问题
400    4)修复了多输入的转换和推理bug
4014. 更新了文档,更新了OP支持列表
402
4032021-6-30
404版本:v1.1.0beta
405更新内容:
4061. 新功能: 混合量化功能(支持自定义是否量化以及量化参数修改);完善了 accuracy_analysis 对比功能(包括连板对比结果)
4072. examples更新:增加了常用接口的demo示例:accuracy_analysis、batch_size、hybrid_quant、load_quantized_model、mmse、multi_input_test
4083. 修复一些已知的bug:
409    1)修复了一些int8/fp16模型的转换问题以及op精度问题
410    2)修复了一些图优化bug,修复了一些依赖的版本问题
4114. 更新了文档,更新了OP支持列表
412
413
414------------------------------------------------------------
4152021-4-30
416版本:v1.0.0
417更新内容:
4181. 新功能: 卷积类的per channel量化功能;添加了config中custom_inf的模型信息设置、img_quant_RGB2BGR设置;添加了eval performance的性能测试接口;增加了版本打印功能
4192. OP支持:1) 添加了Caffe新OP支持:Power/Tile/Eltwise(Max)/去除了normalize维度的限制; 2) 添加了onnx新OP支持:HardSigmoid/Pow/Tile
4203. 修复一些已知的bug:
421    1) 修复了caffe FC的输出shape以及name的错误
422    2) 优化了mmse的量化性能
423    3)修复caffe的Pooling层的输出shape计算错误
424    4)修复了caffe slice丢弃了其中一个输出的inference bug
425    5)修复了一些模型优化的bug
4264. 弃置了reorder_channel的config设置,由用户自行保证inference输入数据的channel正确性
4275. 更新了文档,更新了OP支持列表
428
429
430------------------------------------------------------------
4312021-4-2
432版本:v0.7.0
433更新内容:
4341. 新功能: 新的量化算法支持(mmse), 添加支持tensorflow的预量化模型导入
4352. 添加了Caffe新OP支持:relu6/ConvolutionDepthwise/Transpose/reorg
4363. 修复一些已知的bug:
437    1) 增加concat的非channel维度,非4维输入的支持
438    2) 修复了第一层是scale的预处理bug
439    3)更新了onnxruntime==1.7.0的版本
4404. 更新了文档,更新了OP支持列表
441
442
443------------------------------------------------------------
4442021-3-1
445版本:v0.6.0
446更新内容:
4471. 新功能: caffe load API添加指定输入name的接口;添加了caffe lrn(WithinChannel)的支持
4482. 添加了Caffe新OP支持:crop/flatten/normalize/proposal/reduction
4493. 添加了onnx/pytorch/tensorflow/darknet/tflite新OP支持
4504. 移除了aciq以及Kl散度量化功能
4515. 修复一些已知的bug:
452    1) 最后一层是reshape转换bug;
453    2) 修复了caffe中InnerProduct随机生成blob的bug;
454    3) 修复了过大的size导致GlobalAvgPool GlobalMaxPool crash的问题;
455    4) 修复了第一层是RoIpooling的维度错误;
456    5) 修复了SSD设备端推理错误的问题等。
4576. 更新了文档,增加了OP支持列表
458