一、故障报告

1. 问题(故障)描述

_delimiter:<zcbus>\n" http://10.141.129.200:8030/api/testdb/bd_psndoc/_stream_load                                                           
{
    "TxnId": 21163,
    "Label": "cae29771-94d5-462d-a506-2bd6eacd2643",
    "Comment": "",
    "TwoPhaseCommit": "false",
    "Status": "Fail",
    "Message": "[DATA_QUALITY_ERROR]too many filtered rows",
    "NumberTotalRows": 1,
    "NumberLoadedRows": 0,
    "NumberFilteredRows": 1,
    "NumberUnselectedRows": 0,
    "LoadBytes": 8290539,
    "LoadTimeMs": 88,
    "BeginTxnTimeMs": 1,
    "StreamLoadPutTimeMs": 5,
    "ReadDataTimeMs": 1,
    "WriteDataTimeMs": 80,
    "CommitAndPublishTimeMs": 0,
    "ErrorURL": "http://10.141.129.200:8040/api/_load_error_log?file=__shard_18/error_log_insert_stmt_51436dbb94ccc41d-62673d8273db90bc_51436dbb94ccc41d_62673d8273db90bc"
}
[root@d5fdca907fd6 log]# curl http://10.141.129.200:8040/api/_load_error_log?file=__shard_18/error_log_insert_stmt_51436dbb94ccc41d-62673d8273db90bc_51436dbb94ccc41d_62673d8273db90bc
Reason: column_name[photo], the length of input string is too long than vec schema. first 32 bytes of input str: [89504e470d0a1a0a0000000d49484452] schema length: 2147483643; limit length: 1048576; actual length: 8247464; . src line []; 

2. 问题(故障)原因

doris string类型限制
变长字符串,默认支持 1048576 字节(1MB),可调大到 2147483643 字节(2GB)。可通过 BE 配置 string_type_length_soft_limit_bytes 调整。String 类型只能用在 Value 列,不能用在 Key 列和分区分桶列。

3. 解决

4. 参考

参考: https://doris.apache.org/zh-CN/docs/table-design/data-type

二、实时计算合成表中缺少部分数据

1、问题描述


实时计算过程中,会根据zcbusloadtime 字段来判断计算范围,如上图中所示,当中的这个#zcbus_min# 值取自bus_client_op_full_load_info 中的 start_time 字段的值,即全量开始时间,但是这可能会面临一个问题,当全量开启的时间和数据入库的时间相同时,例如时间都为’2025-10-08 14:23:45’时,实时计算条件值 zcbusoptime>’2025-10-08 14:23:45’ 时则会漏掉部分数据,正确的情况应该修改为zcbusoptime>=’2025-10-08 14:23:45’即可,截止2025-10-20日,问题已提交,待修改

2、临时解决方案:

手动修改值取自bus_client_op_full_load_info中的start_time 字段,将时间点往前推个几十秒即可

三、实时计算合成表数据比源库多

文档更新时间: 2025-10-20 01:31   作者:阿力