12023-5-18 2版本: v1.5.0: 3更新内容: 41. 更新config.dynamic_input的接口定义 52. 修复部分op属性获取失败的问题 6 72023-5-17 8版本: v1.4.6b2: 9更新内容: 101. 修复RK3562 多batch rknn模型C API运行错误的Bug。 11 122023-5-15 13版本: v1.4.6b1: 14更新内容: 151. 修复普通API多输入多输出模型动态shape出错的bug 162. 增加RK3562 Matmul API支持 173. 修复第一层为Reshape时dynamic_input失败的问题 184. 修复opset12~15可能存在的问题 19 202023-5-11 21版本: v1.4.6b0: 22更新内容: 231. 优化RKNN_FLAG_COLLECT_MODEL_INFO_ONLY初始化效率 242. 修复1x1x1x1两个feature Add算子转换Bug 253. 修复load_rknn加载老版本模型出错的兼容性问题 264. 添加opset13/14/15的部分支持 (试验性质) 275. 修复eval_perf导出csv时可能会报错的问题 286. 修复load_rknn报错问题 297. 添加非4维的ReduceXXX支持 30 312023-5-6 32版本: v1.4.5b3: 33更新内容: 341. 增加RKNN_MIN_TIMEOUT_MS环境变量设置NPU提交任务超时的阈值 352. 添加一维Where的支持 363. 修复大模型包含Constant节点报错的问题 374. 优化权重稀疏化的性能 38 392023-4-28 40版本: v1.4.5b2: 41更新内容: 421. 修复dynamic_input普通api结果错误问题 432. 修复非4维输入连板推理报错问题 44 452023-4-27 46版本: v1.4.5b1: 47更新内容: 481. 修复dynamic_input连板推理输出shape报错问题 492. 添加matmul前后transpose的消除规则, 并优化matmul性能 503. 修复大模型编译报错问题 514. 添加load_rknn的dynamic_input支持 525. 修复代码生产时resize出错的问题 53 542023-4-26 55版本: v1.4.5b0: 56更新内容: 571. [RK3562] 优化Transformer模型中的transpose/reshape多算子级联的性能 582. 增加后缀为.torchscript的pytorch文件格式支持 59 602023-4-25 61版本: v1.4.4b5: 62更新内容: 631. 修复dynamic_input在存在Reshape下的推理报错问题 642. 增加dynamic_input多轴动态支持 653. 更新cpp部署代码生成功能 66 672023-4-23 68版本: v1.4.4b3: 69更新内容: 701. 添加dynamic_input功能 712. 修复3维deconv报错问题 723. 更新大模型转换支持 734. 优化模拟器推理性能 745. 添加cpp部署代码生成功能 756. 修复load_rknn的推理问题 76 772023-4-14 78版本: v1.4.3b12: 79更新内容: 801. [RK3562]增加指定层跑CPU/GPU/NPU特性。 812. 修复concat优化规则 823. 添加op_target功能 83 842023-4-11 85版本: v1.4.3b10: 86更新内容: 871. 更新rknn编译器 88 892023-4-10 90版本: v1.4.3b9: 91更新内容: 921. 更新tensorflow QAT支持 932. 优化大模型的转换内存和性能 943. 修复图优化问题,并添加部分新规则 954. 修复mmse报错问题 965. 优化conv的拆分规则 976. 修复混合量化问题 987. 添加RMSNorm支持 998. load_onnx添加input_initial_val参数 1009. 修复onnxoptimizer报错问题 101 1022023-3-28 103版本: v1.4.3b4: 104更新内容: 1051. 修复5维slice的问题 106 1072023-3-27 108版本: v1.4.3b3: 109更新内容: 1101. [RK3566]优化CNN+LSTM结构模型的内存。 1112. 优化Concat性能 1123. load_tflite/load_tensorflow添加input_is_nchw参数 113 1142023-3-23 115版本: v1.4.3b2: 116更新内容: 1171. mul/add/div/sub算子优化。 1182. 修复多级maxpool量化问题 119 1202023-3-21 121版本: v1.4.3b1: 122更新内容: 1231. 修复Expand算子Bug 124 1252023-3-21 126版本: v1.4.3b0: 127更新内容: 1281. [RK3562]增加内部Buffer循环复用功能 1292. [RK3562]优化多batch layerNorm算子精度 1303. [RK3566]int8 Matmul CPU算子优化 1314. [全平台]expand NPU OP支持 1325. [全平台]fp16模型输入耗时优化 1336. 完善Cast算子的支持 1347. 修复remove_weight/多输入归一化参数匹配错误等Bug 1358. 更新常量折叠支持 1369. 更新eval_perf功能 13710. 增加float16模型的支持 13811. 优化常量共享的模型 139 1402023-3-9 141版本: v1.4.2b6: 142更新内容: 1431. RK3562平台Bug修复。 1442. 增加model_pruning控制,并支持deconv,以及Bug修复 1453. 增加If/Loop的部分转换支持 1464. 修复MMSE部分模型失败的问题 1475. 优化仿真器的结果 1486. 增加python3.10的支持 1497. 优化转换内存占用 1508. 增加部分非4维Op支持 151 1522023-2-15 153版本: v1.4.2b1: 154更新内容: 1551. 修复RK3562查询的size_with_stride大小错误问题 156 1572023-2-14 158版本: v1.4.2b0: 159更新内容: 1601. 更新neg支持 1612. 增加min/max的融合优化 1623. 增加了RK3562平台支持 163 1642023-2-8 165版本: v1.4.1b23: 166更新内容: 1671. 修复特定stride反卷积算子的Bug。 1682. 更新MatMul的perchannel量化支持 1693. 更新动态图检测功能 1704. 优化where的量化支持 171 1722023-2-2 173版本: v1.4.1b22: 174更新内容: 1751. 增加Equal算子对Bool类型支持。 1762. 修复Matmul算子/exLayerNorm算子的Bug. 1773. 更新equal/slice/cast/pad/ConvTranspose支持 1784. 更新QAT模型支持 1795. 移除bfloat16包依赖 180 1812023-1-13 182版本: v1.4.1b21: 183更新内容: 1841. 修复RK3588 Matmul接口错误。 1852. 修复4通道输入float16类型模型在RK356X平台查询虚宽错误问题。 1863. 模型不填写量化信息情况下,默认Tensor量化类型为float16。 1874. 增加unk__xxx无效shape支持 1885. 更新abs/dataconvert支持 1896. 优化模型剪枝功能 190 1912023-1-6 192版本: v1.4.1b19: 193更新内容: 1941. [功能]增加Conv+Add+Relu子图融合。 1952. 修复Conv+Add在量化参数不一致情况下融合的Bug。 1963. 修复RK3588 大kernel卷积的Bug。 1974. 增加模型剪枝功能 1985. 优化Sigmoid的量化参数 1996. 增加rk3562的支持 200 2012022-12-17 202版本: v1.4.1b17: 203更新内容: 2041. [优化]增加NPU输出NCHW数据支持。 2052. [功能]增加conv+add+relu融合支持。 2063. 修复最高维度非1模型MaxPool算子错误的Bug。 2074. 修复最高维度非1模型首层Conv错误的Bug。 2085. 修改4维npy的layout定义 2096. 优化dataconvert/gather/transpose/mul/maxpool/sigmoid/pad/conv/relu/softmax支持 2107. 增加aten::upsample_nearest2d支持 2118. 修复仿真器在perchannel下可能的溢出问题 2129. 增加更多的转换错误提示 21310. 更新混合量化支持 214 2152022-11-26 216版本: v1.4.1b14: 217更新内容: 2181. 修复寄存器位宽限制警告。 2192. 优化Concat CPU算子效率。 2203. 增加2维layernorm支持 2214. 更新MatMul支持 222 2232022-11-19 224版本: v1.4.1b13: 225更新内容: 2261. [重要]Android NDK编译器升级到r23b版本,APP建议使用该版本NDK重新编译。 2272. LSTM结构更新升级,需要重新转换模型。 2283. RK356X增加Transpose优化。 2294. RK356X模型非对齐通道的float类型NCHW输出效率优化。 2305. 增加常量输出节点删除功能 2316. MMSE支持无法batch扩维的模型 2327. 修复resize/clip缺失属性的问题 2338. 增加swish/dataconvert/softmax/lstm/layernorm相关优化 2349. 增加离群值检测功能 23510. 优化非4维OP的性能 236 2372022-11-01 238版本: v1.4.1b12: 239更新内容: 2401.修复LSTM模型多次转换结果不一致问题。 2412.改进onnx模型裁剪功能 242 2432022-10-29 244版本: v1.4.1b11: 245更新内容: 2461.修复Runtime外部分配内接口运行LSTM错误问题。 2472.修复Runtime rknn_dup_context接口运行LSTM错误问题。 2483.优化大模型转换性能 2494.添加Loop/Scatter转换支持 250 2512022-10-24 252版本: v1.4.1b10: 253更新内容: 2541.修复LSTM兼容性问题。 2552.修复RK3588输入自动填充虚宽值的重复运行错误的bug。 2563.修复出现size=0的中间tensor刷cache失败的问题(模型需重新生成)。 2574.增加IN、Swish非4维支持 2585.添加tflite支持perchannel的QAT模型 259 2602022-10-19 261版本: v1.4.1b9: 262更新内容: 2631.修复RV1106 rknn_detroy接口内存泄漏问题。 264 2652022-10-18 266版本: v1.4.1b8: 267更新内容: 2681.修复非LSTM模型共享权重时rknn_init失败的bug。 269 2702022-10-17 271版本: v1.4.1b7: 272更新内容: 2731.修复RK3588分支合并后的bug。 274 2752022-10-17 276版本: v1.4.1b6: 277更新内容: 2781.修复大分辨率输入的bug。 2792.优化无效pad 280 2812022-10-13 282版本: v1.4.1b5: 283更新内容: 2841.修复32-bit库matmul错误的bug。 2852.添加FAQ文档 2863.更新图优化规则 2874.调节MatMul量化方式 288 2892022-10-12 290版本: v1.4.1b4: 291更新内容: 2921.修复LSTM共享权重失败问题。 2932.更新图优化规则 294 2952022-10-10 296版本: v1.4.1b3: 297更新内容: 2981. LSTM寄存器配置内存占用的优化。 2992. 优化MMSE量化算法 3003. 优化KL量化算法 301 3022022-9-30 303版本: v1.4.1b2: 304更新内容: 3051. 关闭寄存器差量支持 3062. 增加Batchnorm+Relu融合支持 3073. 增加32-bit Runtime库Neon优化支持。 3084. 优化rknn_init空初始化性能。 3095. 更新精度分析功能 3106. 修复QAT模型的hardsigmoid等问题 3117. 修复lstm/gru图优化问题 3128. 更新图优化规则 313 3142022-9-14 315版本: v1.4.1b1: 316更新内容: 3171. 增加寄存器差量支持 3182. 修复lstm的bug 319 3202022-9-14 321版本: v1.4.1b0: 322更新内容: 3231. 增加rknn.config接口增加npu_do_output_nhwc配置,开启或关闭NPU直接输出NHWC的特性 3242. 修复QAT模型解析问题 325 326 327------------------------------------------------------------ 3282022-8-20 329版本: v1.4.0: 330更新内容: 3311. 升级相关依赖包到主流版本 3322. 添加更多2/3/5维度的Op支持 3333. 更新config/init_runtime等接口 3344. 更新LSTM等Op支持 3355. 添加yuv输入支持 3366. 更新QAT模型支持 337 3382022-7-2 339版本: v1.3.4b5: 340更新内容: 3411. rknn-toolkit2: 342 1) optimize_onnx接口 343 a. 在设置optimization_level=2时,关闭conv+add融合。 344 b. 保留BatchNormalize算子带的量化参数。 345 2) RK3588屏蔽NPU直接输出NHWC layout的支持, RK3566/RV1106保留该功能。 3462. C API: 347 1) RK3588/RK3566/RV1106支持传入一个包含rknn模型的大文件路径,rknn_init接口设置包含偏移和真实rknn模型大小的rknn_init_extend结构体指针。 348 349 350------------------------------------------------------------ 3512021-4-22 352版本: v1.3.0: 353更新内容: 3541. 新功能: python3.8/ubuntu20.04 平台支持 3552. 修复一些已知的bug: 356 1) 修复了一些图优化和量化bug 357 3582021-4-7 359版本: v1.2.5: 360更新内容: 3611. 新功能: rv1103/rv1109平台的支持. 3622. 修复一些已知的bug: 363 1) 修复了一些QAT模型转换问题 364 2) 修复了一些图优化bug 365 366 3672021-1-27 368版本: v1.2.1-beta: 369更新内容: 3701. 新功能: 多batch的NHWC格式输入时,在H维度,有效元素个数与实际内存中的元素个数不一致时,支持H方向实际元素个数按照h_stride设置. 3712. 修复一些已知的bug: 372 1) LSTM算子内部变量重名的问题. 373 374 375------------------------------------------------------------ 3762021-1-12 377版本:v1.2.0 378更新内容: 3791. 新功能: rk3588平台的支持; rknn模型加密支持; tensorflow/tflite/pytorch量化感知模型支持; 增加了一些新的 op 支持: InstanceNormalization, Swish, Conv1D等(详见 op support list);增加了参数量计算以及算力分析 3802. examples 更新:增加了从 pytorch 转 onnx 的转换 demo:resnet18_export_onnx ;增加了pytorch量化感知模型的加载demo:resnet18_qat demo;增加了模型加密功能:添加了3588平台 rknn 转换 demo 3813. 接口更改:移除了 config,load_caffe,load_tensorflow等接口的一些不必要的参数设置,更新了 eval_perf 接口,详细改动见Uer_Guide文档 3824. 修复一些已知的bug: 383 1) 修复了一些模型无法转换rknn的问题 384 2) 修复了一些图优化bug 385 3) 修复了一些模型推理结果错误的问题 386 4) 修复了 pytorch、tflite 某些 op 转换失败的问题 3875. 优化: 精度分析耗时优化; 模型转换和量化耗时优化 388 389 390------------------------------------------------------------ 3912021-8-12 392版本:v1.1.0 393更新内容: 3941. 新功能: LSTM,GRU的支持;增加了accuracy_analysis对比项目;增加了一些op支持:caffe hardswish;onnx gather,reduceMax等op;更新了更全面的图优化规则。 3952. examples更新:增加了yolov5的demo 3963. 修复一些已知的bug: 397 1)修复了一些模拟器的推理结果错误问题 398 2)修复了一些图优化bug 399 3)修复了一些大模型无法转换rknn的问题 400 4)修复了多输入的转换和推理bug 4014. 更新了文档,更新了OP支持列表 402 4032021-6-30 404版本:v1.1.0beta 405更新内容: 4061. 新功能: 混合量化功能(支持自定义是否量化以及量化参数修改);完善了 accuracy_analysis 对比功能(包括连板对比结果) 4072. examples更新:增加了常用接口的demo示例:accuracy_analysis、batch_size、hybrid_quant、load_quantized_model、mmse、multi_input_test 4083. 修复一些已知的bug: 409 1)修复了一些int8/fp16模型的转换问题以及op精度问题 410 2)修复了一些图优化bug,修复了一些依赖的版本问题 4114. 更新了文档,更新了OP支持列表 412 413 414------------------------------------------------------------ 4152021-4-30 416版本:v1.0.0 417更新内容: 4181. 新功能: 卷积类的per channel量化功能;添加了config中custom_inf的模型信息设置、img_quant_RGB2BGR设置;添加了eval performance的性能测试接口;增加了版本打印功能 4192. OP支持:1) 添加了Caffe新OP支持:Power/Tile/Eltwise(Max)/去除了normalize维度的限制; 2) 添加了onnx新OP支持:HardSigmoid/Pow/Tile 4203. 修复一些已知的bug: 421 1) 修复了caffe FC的输出shape以及name的错误 422 2) 优化了mmse的量化性能 423 3)修复caffe的Pooling层的输出shape计算错误 424 4)修复了caffe slice丢弃了其中一个输出的inference bug 425 5)修复了一些模型优化的bug 4264. 弃置了reorder_channel的config设置,由用户自行保证inference输入数据的channel正确性 4275. 更新了文档,更新了OP支持列表 428 429 430------------------------------------------------------------ 4312021-4-2 432版本:v0.7.0 433更新内容: 4341. 新功能: 新的量化算法支持(mmse), 添加支持tensorflow的预量化模型导入 4352. 添加了Caffe新OP支持:relu6/ConvolutionDepthwise/Transpose/reorg 4363. 修复一些已知的bug: 437 1) 增加concat的非channel维度,非4维输入的支持 438 2) 修复了第一层是scale的预处理bug 439 3)更新了onnxruntime==1.7.0的版本 4404. 更新了文档,更新了OP支持列表 441 442 443------------------------------------------------------------ 4442021-3-1 445版本:v0.6.0 446更新内容: 4471. 新功能: caffe load API添加指定输入name的接口;添加了caffe lrn(WithinChannel)的支持 4482. 添加了Caffe新OP支持:crop/flatten/normalize/proposal/reduction 4493. 添加了onnx/pytorch/tensorflow/darknet/tflite新OP支持 4504. 移除了aciq以及Kl散度量化功能 4515. 修复一些已知的bug: 452 1) 最后一层是reshape转换bug; 453 2) 修复了caffe中InnerProduct随机生成blob的bug; 454 3) 修复了过大的size导致GlobalAvgPool GlobalMaxPool crash的问题; 455 4) 修复了第一层是RoIpooling的维度错误; 456 5) 修复了SSD设备端推理错误的问题等。 4576. 更新了文档,增加了OP支持列表 458