From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <SRS0=Ta2D=3F=vger.kernel.org=linux-rdma-owner@kernel.org>
X-Spam-Checker-Version: SpamAssassin 3.4.0 (2014-02-07) on
	aws-us-west-2-korg-lkml-1.web.codeaurora.org
X-Spam-Level: 
X-Spam-Status: No, score=-7.1 required=3.0 tests=DKIMWL_WL_HIGH,DKIM_SIGNED,
	DKIM_VALID,DKIM_VALID_AU,INCLUDES_PATCH,MAILING_LIST_MULTI,SIGNED_OFF_BY,
	SPF_HELO_NONE,SPF_PASS autolearn=unavailable autolearn_force=no version=3.4.0
Received: from mail.kernel.org (mail.kernel.org [198.145.29.99])
	by smtp.lore.kernel.org (Postfix) with ESMTP id 95BACC3F68F
	for <linux-rdma@archiver.kernel.org>; Thu, 16 Jan 2020 14:53:05 +0000 (UTC)
Received: from vger.kernel.org (vger.kernel.org [209.132.180.67])
	by mail.kernel.org (Postfix) with ESMTP id 6C7D4207FF
	for <linux-rdma@archiver.kernel.org>; Thu, 16 Jan 2020 14:53:05 +0000 (UTC)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/simple; d=kernel.org;
	s=default; t=1579186385;
	bh=dQqfTqIIu6fJ7/giuDQ5SBqd0gKLZSiatCOMvOPXdsQ=;
	h=Date:From:To:Cc:Subject:References:In-Reply-To:List-ID:From;
	b=LkzchFDKLRf68+MYAEkSr9pxP7RBG+B7CAarRLVnZj+E3mSLDC+deeS/2zAjOg051
	 Kt5fwQF2qIiUOAr/pWgG2H0yEz9gELMrII7madvlsQDOOe6oY88OejEJTCHKu8/lnz
	 nJkCDSfR3O+8IAfwpOPHsixc2SPIF0IQIOs/V17M=
Received: (majordomo@vger.kernel.org) by vger.kernel.org via listexpand
        id S1726853AbgAPOxE (ORCPT <rfc822;linux-rdma@archiver.kernel.org>);
        Thu, 16 Jan 2020 09:53:04 -0500
Received: from mail.kernel.org ([198.145.29.99]:40832 "EHLO mail.kernel.org"
        rhost-flags-OK-OK-OK-OK) by vger.kernel.org with ESMTP
        id S1726371AbgAPOxE (ORCPT <rfc822;linux-rdma@vger.kernel.org>);
        Thu, 16 Jan 2020 09:53:04 -0500
Received: from localhost (unknown [213.57.247.131])
        (using TLSv1.2 with cipher ECDHE-RSA-AES256-GCM-SHA384 (256/256 bits))
        (No client certificate requested)
        by mail.kernel.org (Postfix) with ESMTPSA id 132B920748;
        Thu, 16 Jan 2020 14:53:02 +0000 (UTC)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/simple; d=kernel.org;
        s=default; t=1579186383;
        bh=dQqfTqIIu6fJ7/giuDQ5SBqd0gKLZSiatCOMvOPXdsQ=;
        h=Date:From:To:Cc:Subject:References:In-Reply-To:From;
        b=dkx5DvvxGmlP1vs771Inud2EmKOha59DFEu3BbQ9Deh5cZedJJAEPKIBgsL9/oOgl
         Ub135nUEShFfQ5eL+8upetN8kOp/ByAu+0wu+uzgObRNLxFUBQrh4knprCGIv6g5JA
         sLcUoLnPRKUjDwY3VXNEh7s6AZnPnnH70EUxRhCo=
Date:   Thu, 16 Jan 2020 16:53:00 +0200
From:   Leon Romanovsky <leon@kernel.org>
To:     Jack Wang <jinpuwang@gmail.com>
Cc:     linux-block@vger.kernel.org, linux-rdma@vger.kernel.org,
        axboe@kernel.dk, hch@infradead.org, sagi@grimberg.me,
        bvanassche@acm.org, dledford@redhat.com, jgg@ziepe.ca,
        danil.kipnis@cloud.ionos.com, jinpu.wang@cloud.ionos.com,
        rpenyaev@suse.de
Subject: Re: [PATCH v7 06/25] RDMA/rtrs: client: main functionality
Message-ID: <20200116145300.GC12433@unreal>
References: <20200116125915.14815-1-jinpuwang@gmail.com>
 <20200116125915.14815-7-jinpuwang@gmail.com>
MIME-Version: 1.0
Content-Type: text/plain; charset=us-ascii
Content-Disposition: inline
In-Reply-To: <20200116125915.14815-7-jinpuwang@gmail.com>
Sender: linux-rdma-owner@vger.kernel.org
Precedence: bulk
List-ID: <linux-rdma.vger.kernel.org>
X-Mailing-List: linux-rdma@vger.kernel.org

On Thu, Jan 16, 2020 at 01:58:56PM +0100, Jack Wang wrote:
> From: Jack Wang <jinpu.wang@cloud.ionos.com>
>
> This is main functionality of rtrs-client module, which manages
> set of RDMA connections for each rtrs session, does multipathing,
> load balancing and failover of RDMA requests.
>
> Signed-off-by: Danil Kipnis <danil.kipnis@cloud.ionos.com>
> Signed-off-by: Jack Wang <jinpu.wang@cloud.ionos.com>
> ---
>  drivers/infiniband/ulp/rtrs/rtrs-clt.c | 2967 ++++++++++++++++++++++++
>  1 file changed, 2967 insertions(+)
>  create mode 100644 drivers/infiniband/ulp/rtrs/rtrs-clt.c
>
> diff --git a/drivers/infiniband/ulp/rtrs/rtrs-clt.c b/drivers/infiniband/ulp/rtrs/rtrs-clt.c
> new file mode 100644
> index 000000000000..717d19d4d930
> --- /dev/null
> +++ b/drivers/infiniband/ulp/rtrs/rtrs-clt.c
> @@ -0,0 +1,2967 @@
> +// SPDX-License-Identifier: GPL-2.0-or-later
> +/*
> + * RDMA Transport Layer
> + *
> + * Copyright (c) 2014 - 2018 ProfitBricks GmbH. All rights reserved.
> + *
> + * Copyright (c) 2018 - 2019 1&1 IONOS Cloud GmbH. All rights reserved.
> + *
> + * Copyright (c) 2019 - 2020 1&1 IONOS SE. All rights reserved.

Please no extra lines between Copyright lines.

> + */
> +
> +#undef pr_fmt
> +#define pr_fmt(fmt) KBUILD_MODNAME " L" __stringify(__LINE__) ": " fmt

I never understood this pr_fmt() thing, do we really need it?

> +
> +#include <linux/module.h>
> +#include <linux/rculist.h>
> +#include <linux/blkdev.h> /* for BLK_MAX_SEGMENT_SIZE */
> +
> +#include "rtrs-clt.h"
> +#include "rtrs-log.h"
> +
> +#define RTRS_CONNECT_TIMEOUT_MS 30000
> +
> +MODULE_DESCRIPTION("RDMA Transport Client");
> +MODULE_LICENSE("GPL");
> +
> +static ushort nr_cons_per_session;
> +module_param(nr_cons_per_session, ushort, 0444);
> +MODULE_PARM_DESC(nr_cons_per_session,
> +		 "Number of connections per session. (default: nr_cpu_ids)");
> +
> +static int retry_cnt = 7;
> +module_param_named(retry_cnt, retry_cnt, int, 0644);
> +MODULE_PARM_DESC(retry_cnt,
> +		 "Number of times to send the message if the remote side didn't respond with Ack or Nack (default: 7, min: "
> +		 __stringify(MIN_RTR_CNT) ", max: "
> +		 __stringify(MAX_RTR_CNT) ")");
> +
> +static int __read_mostly noreg_cnt;
> +module_param_named(noreg_cnt, noreg_cnt, int, 0444);
> +MODULE_PARM_DESC(noreg_cnt,
> +		 "Max number of SG entries when MR registration does not happen (default: 0)");

We don't like modules in new code.

> +
> +static const struct rtrs_rdma_dev_pd_ops dev_pd_ops;
> +static struct rtrs_rdma_dev_pd dev_pd = {
> +	.ops = &dev_pd_ops
> +};
> +
> +static struct workqueue_struct *rtrs_wq;
> +static struct class *rtrs_clt_dev_class;
> +
> +static inline bool rtrs_clt_is_connected(const struct rtrs_clt *clt)
> +{
> +	struct rtrs_clt_sess *sess;
> +	bool connected = false;
> +
> +	rcu_read_lock();
> +	list_for_each_entry_rcu(sess, &clt->paths_list, s.entry)
> +		connected |= (READ_ONCE(sess->state) == RTRS_CLT_CONNECTED);
> +	rcu_read_unlock();
> +
> +	return connected;
> +}
> +
> +static inline struct rtrs_permit *
> +__rtrs_get_permit(struct rtrs_clt *clt, enum rtrs_clt_con_type con_type)
> +{
> +	size_t max_depth = clt->queue_depth;
> +	struct rtrs_permit *permit;
> +	int cpu, bit;
> +
> +	/* Combined with cq_vector, we pin the IO to the the cpu it comes */
> +	cpu = get_cpu();
> +	do {
> +		bit = find_first_zero_bit(clt->permits_map, max_depth);
> +		if (unlikely(bit >= max_depth)) {
> +			put_cpu();
> +			return NULL;
> +		}
> +
> +	} while (unlikely(test_and_set_bit_lock(bit, clt->permits_map)));
> +	put_cpu();
> +
> +	permit = GET_PERMIT(clt, bit);
> +	WARN_ON(permit->mem_id != bit);
> +	permit->cpu_id = cpu;
> +	permit->con_type = con_type;
> +
> +	return permit;
> +}
> +
> +static inline void __rtrs_put_permit(struct rtrs_clt *clt,
> +				      struct rtrs_permit *permit)
> +{
> +	clear_bit_unlock(permit->mem_id, clt->permits_map);
> +}
> +
> +struct rtrs_permit *rtrs_clt_get_permit(struct rtrs_clt *clt,
> +					  enum rtrs_clt_con_type con_type,
> +					  int can_wait)
> +{
> +	struct rtrs_permit *permit;
> +	DEFINE_WAIT(wait);
> +
> +	permit = __rtrs_get_permit(clt, con_type);
> +	if (likely(permit) || !can_wait)
> +		return permit;
> +
> +	do {
> +		prepare_to_wait(&clt->permits_wait, &wait,
> +				TASK_UNINTERRUPTIBLE);
> +		permit = __rtrs_get_permit(clt, con_type);
> +		if (likely(permit))
> +			break;
> +
> +		io_schedule();
> +	} while (1);
> +
> +	finish_wait(&clt->permits_wait, &wait);
> +
> +	return permit;
> +}
> +EXPORT_SYMBOL(rtrs_clt_get_permit);
> +
> +void rtrs_clt_put_permit(struct rtrs_clt *clt, struct rtrs_permit *permit)
> +{
> +	if (WARN_ON(!test_bit(permit->mem_id, clt->permits_map)))
> +		return;
> +
> +	__rtrs_put_permit(clt, permit);
> +
> +	/*
> +	 * Putting a permit is a barrier, so we will observe
> +	 * new entry in the wait list, no worries.
> +	 */
> +	if (waitqueue_active(&clt->permits_wait))

Where do you put permit? Does it include barrier?

> +		wake_up(&clt->permits_wait);
> +}
> +EXPORT_SYMBOL(rtrs_clt_put_permit);
> +
> +struct rtrs_permit *rtrs_permit_from_pdu(void *pdu)
> +{
> +	return pdu - sizeof(struct rtrs_permit);

C standard doesn't allow pointer arithmetic on void*.

> +}
> +EXPORT_SYMBOL(rtrs_permit_from_pdu);
> +
> +void *rtrs_permit_to_pdu(struct rtrs_permit *permit)
> +{
> +	return permit + 1;
> +}
> +EXPORT_SYMBOL(rtrs_permit_to_pdu);
> +
> +/**
> + * rtrs_permit_to_clt_con() - returns RDMA connection pointer by the permit
> + * @sess: client session pointer
> + * @permit: permit for the allocation of the RDMA buffer
> + * Note:
> + *     IO connection starts from 1.
> + *     0 connection is for user messages.
> + */
> +static
> +struct rtrs_clt_con *rtrs_permit_to_clt_con(struct rtrs_clt_sess *sess,
> +					    struct rtrs_permit *permit)
> +{
> +	int id = 0;
> +
> +	if (likely(permit->con_type == RTRS_IO_CON))
> +		id = (permit->cpu_id % (sess->s.con_num - 1)) + 1;
> +
> +	return to_clt_con(sess->s.con[id]);
> +}
> +
> +static bool __rtrs_clt_change_state(struct rtrs_clt_sess *sess,
> +				     enum rtrs_clt_state new_state)
> +{
> +	enum rtrs_clt_state old_state;
> +	bool changed = false;
> +
> +	lockdep_assert_held(&sess->state_wq.lock);
> +
> +	old_state = sess->state;
> +	switch (new_state) {
> +	case RTRS_CLT_CONNECTING:
> +		switch (old_state) {

Double switch is better to be avoided.

> +		case RTRS_CLT_RECONNECTING:
> +			changed = true;
> +			/* FALLTHRU */
> +		default:
> +			break;
> +		}
> +		break;


....

Thanks