阅读 94

Kafka源码分析16-消息有异常如何处理?

private void completeBatch(RecordBatch batch, ProduceResponse.PartitionResponse response, long correlationId,
                           long now) {
    //如果处理成功那就是成功了,但是如果服务端那儿处理失败了,是不是也要给我们发送回来异常的信息。
    //error 这个里面存储的就是服务端发送回来的异常码
    Errors error = response.error;
    //如果响应里面带有异常 并且 这个请求是可以重试的
    if (error != Errors.NONE && canRetry(batch, error)) {
        // retry
        log.warn("Got error produce response with correlation id {} on topic-partition {}, retrying ({} attempts left). Error: {}",
                 correlationId,
                 batch.topicPartition,
                 this.retries - batch.attempts - 1,
                 error);
        //重新把发送失败等着批次 加入到队列里面。
        this.accumulator.reenqueue(batch, now);
        this.sensors.recordRetries(batch.topicPartition.topic(), batch.recordCount);
    } else {
        //这儿过来的数据:带有异常,但是不可以重试(1:压根就不让重试2:重试次数超了)

        //其余的都走这个分支。
        RuntimeException exception;
        //如果响应里面带有 没有权限的异常
        if (error == Errors.TOPIC_AUTHORIZATION_FAILED)
            //自己封装一个异常信息(自定义了异常)
            exception = new TopicAuthorizationException(batch.topicPartition.topic());
        else
            exception = error.exception();
        // tell the user the result of their request
        //TODO 核心代码 把异常的信息也给带过去了
        //我们刚刚看的就是这儿的代码
        //里面调用了用户传进来的回调函数
        //回调函数调用了以后
        //说明我们的一个完整的消息的发送流程就结束了。
        batch.done(response.baseOffset, response.logAppendTime, exception);
        //看起来这个代码就是要回收资源的。
        this.accumulator.deallocate(batch);
        if (error != Errors.NONE)
            this.sensors.recordErrors(batch.topicPartition.topic(), batch.recordCount);
    }
    if (error.exception() instanceof InvalidMetadataException) {
        if (error.exception() instanceof UnknownTopicOrPartitionException)
            log.warn("Received unknown topic or partition error in produce request on partition {}. The " +
                    "topic/partition may not exist or the user may not have Describe access to it", batch.topicPartition);
        metadata.requestUpdate();
    }

    // Unmute the completed partition.
    if (guaranteeMessageOrder)
        this.accumulator.unmutePartition(batch.topicPartition);
}复制代码

首先,我们先判断一下能否重试? canRetry(batch, error)

private boolean canRetry(RecordBatch batch, Errors error) {
    return batch.attempts < this.retries && error.exception() instanceof RetriableException;
}复制代码

可以重试的条件:使用重试次数小于配置重试次数 && 属于可重试的异常;

下面这些都属于可重试的异常:

下面分为2中情况:

(1)如果消息可以重试调用accumulator.reenqueue(batch, now)

public void reenqueue(RecordBatch batch, long now) {
    batch.attempts++;
    batch.lastAttemptMs = now;
    batch.lastAppendTime = now;
    batch.setRetry();
    Deque<RecordBatch> deque = getOrCreateDeque(batch.topicPartition);
    synchronized (deque) {
        deque.addFirst(batch);
    }
}复制代码

        重试的Batch会放入到队列的头部,不是尾部,这样的话,下一次循环的时候就可以优先处理这个要重新发送的Batch了,attempts、lastAttemptMs这些参数都会进行设置,辅助判断这个Batch下一次是什么时候要进行重试发送

(2)消息不可以重试

此时会调用producer.send()方法传过来的回调函数,进行异常的处理


作者:hsfxuebao
链接:https://juejin.cn/post/7019562761273212941

文章分类
后端
版权声明:本站是系统测试站点,无实际运营。本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 XXXXXXo@163.com 举报,一经查实,本站将立刻删除。
相关推荐