ns/rdc/rdc_clnt.c

	rdc_clnt.c revision 3270659f55e0928d6edec3d26217cc29398a8149
/*
 * CDDL HEADER START
 *
 * The contents of this file are subject to the terms of the
 * Common Development and Distribution License (the "License").
 * You may not use this file except in compliance with the License.
 *
 * You can obtain a copy of the license at usr/src/OPENSOLARIS.LICENSE
 * or http://www.opensolaris.org/os/licensing.
 * See the License for the specific language governing permissions
 * and limitations under the License.
 *
 * When distributing Covered Code, include this CDDL HEADER in each
 * file and include the License file at usr/src/OPENSOLARIS.LICENSE.
 * If applicable, add the following below this CDDL HEADER, with the
 * fields enclosed by brackets "[]" replaced with your own identifying
 * information: Portions Copyright [yyyy] [name of copyright owner]
 *
 * CDDL HEADER END
 */
/*
 * Copyright 2009 Sun Microsystems, Inc.  All rights reserved.
 * Use is subject to license terms.
 */

/* Network data replicator Client side */


#include <sys/types.h>
#include <sys/debug.h>
#include <sys/ksynch.h>
#include <sys/cmn_err.h>
#include <sys/kmem.h>
#include <sys/cred.h>
#include <sys/byteorder.h>
#include <sys/errno.h>

#ifdef _SunOS_2_6
/*
 * on 2.6 both dki_lock.h and rpc/types.h define bool_t so we
 * define enum_t here as it is all we need from rpc/types.h
 * anyway and make it look like we included it. Yuck.
 */
#define _RPC_TYPES_H
typedef int enum_t;
#else
#ifndef DS_DDICT
#include <rpc/types.h>
#endif
#endif /* _SunOS_2_6 */

#ifndef DS_DDICT
#include <rpc/auth.h>
#include <rpc/svc.h>
#include <rpc/xdr.h>
#endif
#include <sys/ddi.h>

#include <sys/nsc_thread.h>
#ifdef DS_DDICT
#include <sys/nsctl/contract.h>
#endif
#include <sys/nsctl/nsctl.h>

#include <sys/sdt.h>        /* dtrace is S10 or later */

#include "rdc_io.h"
#include "rdc_clnt.h"
#include "rdc_bitmap.h"
#include "rdc_diskq.h"


kmutex_t rdc_clnt_lock;

#ifdef DEBUG
int noflush = 0;
#endif

int rdc_rpc_tmout = RDC_CLNT_TMOUT;
static void rdc_clnt_free(struct chtab *, CLIENT *);
static void _rdc_remote_flush(rdc_aio_t *);

void rdc_flush_memq(int index);
void rdc_flush_diskq(int index);
int rdc_drain_net_queue(int index);
void rdc_flusher_thread(int index);
int  rdc_diskq_enqueue(rdc_k_info_t *krdc, rdc_aio_t *);
void rdc_init_diskq_header(rdc_group_t *grp, dqheader *hd);
void rdc_dump_iohdrs(disk_queue *dq);
rdc_aio_t *rdc_dequeue(rdc_k_info_t *krdc, int *rc);
void rdc_clr_iohdr(rdc_k_info_t *krdc, nsc_off_t qpos);
void rdc_close_diskq(rdc_group_t *krdc);

int rdc_writer(int index);

static struct chtab *rdc_chtable = NULL;
static int rdc_clnt_toomany;
#ifdef DEBUG
static int rdc_ooreply;
#endif

extern void rdc_fail_diskq(rdc_k_info_t *krdc, int wait, int flag);
extern int _rdc_rsrv_diskq(rdc_group_t *group);
extern void _rdc_rlse_diskq(rdc_group_t *group);

static enum clnt_stat
cl_call_sig(struct __client *rh, rpcproc_t proc,
        xdrproc_t xargs, caddr_t argsp, xdrproc_t xres,
        caddr_t resp, struct timeval secs)
{
    enum clnt_stat stat;
    k_sigset_t smask;
    sigintr(&smask, 0);
    rh->cl_nosignal = TRUE;
    stat = ((*(rh)->cl_ops->cl_call)\
        (rh, proc, xargs, argsp, xres, resp, secs));
    rh->cl_nosignal = FALSE;
    sigunintr(&smask);
    return (stat);
}

int
rdc_net_getsize(int index, uint64_t *sizeptr)
{
    struct timeval t;
    int err, size;
    rdc_k_info_t *krdc = &rdc_k_info[index];
    int remote_index = krdc->remote_index;

    *sizeptr = 0;
    if (krdc->remote_index < 0)
        return (EINVAL);

    t.tv_sec = rdc_rpc_tmout;
    t.tv_usec = 0;

#ifdef DEBUG
    if (krdc->intf == NULL)
        cmn_err(CE_WARN,
            "!rdc_net_getsize: null intf for index %d", index);
#endif
    if (krdc->rpc_version <= RDC_VERSION5) {
        err = rdc_clnt_call(krdc->lsrv, RDCPROC_GETSIZE,
            krdc->rpc_version, xdr_int, (char *)&remote_index,
            xdr_int, (char *)&size, &t);
        if (err == 0)
            *sizeptr = size;
    } else {
        err = rdc_clnt_call(krdc->lsrv, RDCPROC_GETSIZE6,
            krdc->rpc_version, xdr_int, (char *)&remote_index,
            xdr_u_longlong_t, (char *)sizeptr, &t);
    }
    return (err);
}


int
rdc_net_state(int index, int options)
{
    struct timeval t;
    int err;
    int remote_index = -1;
    rdc_u_info_t *urdc = &rdc_u_info[index];
    rdc_k_info_t *krdc = &rdc_k_info[index];
    struct set_state s;
    struct set_state4 s4;
    char neta[32], rneta[32];
    unsigned short *sp;

    t.tv_sec = rdc_rpc_tmout;
    t.tv_usec = 0;

    if (krdc->rpc_version < RDC_VERSION7) {
        s4.netaddrlen = urdc->primary.addr.len;
        s4.rnetaddrlen = urdc->secondary.addr.len;
        bcopy(urdc->primary.addr.buf, s4.netaddr, s4.netaddrlen);
        bcopy(urdc->secondary.addr.buf, s4.rnetaddr, s4.rnetaddrlen);
        (void) strncpy(s4.pfile, urdc->primary.file, RDC_MAXNAMLEN);
        (void) strncpy(s4.sfile, urdc->secondary.file, RDC_MAXNAMLEN);
        s4.flag = options;

        err = rdc_clnt_call(krdc->lsrv, RDCPROC_STATE,
            krdc->rpc_version, xdr_set_state4, (char *)&s4, xdr_int,
            (char *)&remote_index, &t);
    } else {
        s.netaddrlen = urdc->primary.addr.len;
        s.rnetaddrlen = urdc->secondary.addr.len;
        s.netaddr.buf = neta;
        s.rnetaddr.buf = rneta;
        bcopy(urdc->primary.addr.buf, s.netaddr.buf, s.netaddrlen);
        bcopy(urdc->secondary.addr.buf, s.rnetaddr.buf, s.rnetaddrlen);
        s.netaddr.len = urdc->primary.addr.len;
        s.rnetaddr.len = urdc->secondary.addr.len;
        s.netaddr.maxlen = urdc->primary.addr.len;
        s.rnetaddr.maxlen = urdc->secondary.addr.len;
        sp = (unsigned short *)s.netaddr.buf;
        *sp = htons(*sp);
        sp = (unsigned short *)s.rnetaddr.buf;
        *sp = htons(*sp);
        s.pfile = urdc->primary.file;
        s.sfile = urdc->secondary.file;
        s.flag = options;

        err = rdc_clnt_call(krdc->lsrv, RDCPROC_STATE,
            krdc->rpc_version, xdr_set_state, (char *)&s, xdr_int,
            (char *)&remote_index, &t);
    }

    if (err)
        return (-1);
    else
        return (remote_index);
}


/*
 * rdc_net_getbmap
 * gets the bitmaps from remote side and or's them  with remote bitmap
 */
int
rdc_net_getbmap(int index, int size)
{
    struct timeval t;
    int err;
    struct bmap b;
    struct bmap6 b6;
    rdc_k_info_t *krdc;

    krdc = &rdc_k_info[index];

    if (krdc->remote_index < 0)
        return (EINVAL);

    t.tv_sec = rdc_rpc_tmout;
    t.tv_usec = 0;
#ifdef DEBUG
    if (krdc->intf == NULL)
        cmn_err(CE_WARN,
            "!rdc_net_getbmap: null intf for index %d", index);
#endif

    if (krdc->rpc_version <= RDC_VERSION5) {
        b.cd = krdc->remote_index;
        b.dual = index;
        b.size = size;
        err = rdc_clnt_call(krdc->lsrv, RDCPROC_BMAP,
            krdc->rpc_version, xdr_bmap, (char *)&b, xdr_int,
            (char *)&err, &t);

    } else {
        b6.cd = krdc->remote_index;
        b6.dual = index;
        b6.size = size;
        err = rdc_clnt_call(krdc->lsrv, RDCPROC_BMAP6,
            krdc->rpc_version, xdr_bmap6, (char *)&b6, xdr_int,
            (char *)&err, &t);
    }
    return (err);
}

int sndr_proto = 0;

/*
 * return state corresponding to rdc_host
 */
int
rdc_net_getstate(rdc_k_info_t *krdc, int *serial_mode, int *use_mirror,
    int *mirror_down, int network)
{
    int err;
    struct timeval t;
    int state;
    rdc_u_info_t *urdc = &rdc_u_info[krdc->index];
    struct set_state s;
#ifdef sparc
    struct set_state4 s4;
#endif
    char neta[32];
    char rneta[32];
    unsigned short *sp;
    char *setp = (char *)&s;
    xdrproc_t xdr_proc = xdr_set_state;

    if (krdc->lsrv && (krdc->intf == NULL || krdc->intf->if_down) &&
        network) /* fail fast */
        return (-1);

    s.netaddrlen = urdc->primary.addr.len;
    s.rnetaddrlen = urdc->secondary.addr.len;
    s.pfile = urdc->primary.file;
    s.sfile = urdc->secondary.file;
    s.netaddr.buf = neta;
    s.rnetaddr.buf = rneta;
    bcopy(urdc->primary.addr.buf, s.netaddr.buf, s.netaddrlen);
    bcopy(urdc->secondary.addr.buf, s.rnetaddr.buf, s.rnetaddrlen);
    sp = (unsigned short *) s.netaddr.buf;
    *sp = htons(*sp);
    sp = (unsigned short *) s.rnetaddr.buf;
    *sp = htons(*sp);
    s.netaddr.len = urdc->primary.addr.len;
    s.rnetaddr.len = urdc->secondary.addr.len;
    s.netaddr.maxlen = urdc->primary.addr.maxlen;
    s.rnetaddr.maxlen = urdc->secondary.addr.maxlen;
    s.flag = 0;

    t.tv_sec = rdc_rpc_tmout;
    t.tv_usec = 0;

    if (sndr_proto)
        krdc->rpc_version = sndr_proto;
    else
        krdc->rpc_version = RDC_VERS_MAX;

again:
    err = rdc_clnt_call(krdc->lsrv, RDCPROC_GETSTATE4, krdc->rpc_version,
        xdr_proc, setp, xdr_int, (char *)&state, &t);

    if (err == RPC_PROGVERSMISMATCH && (krdc->rpc_version !=
        RDC_VERS_MIN)) {
        if (krdc->rpc_version-- == RDC_VERSION7) {
            /* set_state struct changed with v7 of protocol */
#ifdef sparc
            s4.netaddrlen = urdc->primary.addr.len;
            s4.rnetaddrlen = urdc->secondary.addr.len;
            bcopy(urdc->primary.addr.buf, s4.netaddr,
                s4.netaddrlen);
            bcopy(urdc->secondary.addr.buf, s4.rnetaddr,
                s4.rnetaddrlen);
            (void) strncpy(s4.pfile, urdc->primary.file,
                RDC_MAXNAMLEN);
            (void) strncpy(s4.sfile, urdc->secondary.file,
                RDC_MAXNAMLEN);
            s4.flag = 0;
            xdr_proc = xdr_set_state4;
            setp = (char *)&s4;
#else
            /* x64 can not use protocols < 7 */
            return (-1);
#endif
        }
        goto again;
    }
#ifdef DEBUG
    cmn_err(CE_NOTE, "!sndr get_state: Protocol ver %d", krdc->rpc_version);
#endif

    if (err) {
        return (-1);
    }

    if (state == -1)
        return (-1);

    if (serial_mode)
        *serial_mode = (state >> 2) & 1;
    if (use_mirror)
        *use_mirror = (state >> 1) & 1;
    if (mirror_down)
        *mirror_down = state & 1;

    return (0);
}


static struct xdr_discrim rdres_discrim[2] = {
    { (int)RDC_OK, xdr_readok },
    { __dontcare__, NULL_xdrproc_t }
};


/*
 * Reply from remote read (client side)
 */
static bool_t
xdr_rdresult(XDR *xdrs, readres *rr)
{

    return (xdr_union(xdrs, (enum_t *)&(rr->rr_status),
        (caddr_t)&(rr->rr_ok), rdres_discrim, xdr_void));
}

static int
rdc_rrstatus_decode(int status)
{
    int ret = 0;

    if (status != RDC_OK) {
        switch (status) {
        case RDCERR_NOENT:
            ret = ENOENT;
            break;
        case RDCERR_NOMEM:
            ret = ENOMEM;
            break;
        default:
            ret = EIO;
            break;
        }
    }

    return (ret);
}


int
rdc_net_read(int local_index, int remote_index, nsc_buf_t *handle,
    nsc_off_t fba_pos, nsc_size_t fba_len)
{
    struct rdcrdresult rr;
    rdc_k_info_t *krdc;
    rdc_u_info_t *urdc;
    struct rread list;
    struct rread6 list6;
    struct timeval t;
    uchar_t *sv_addr;
    nsc_vec_t *vec;
    int rpc_flag;
    nsc_size_t sv_len;
    int err;
    int ret;
    nsc_size_t len;
    nsc_size_t maxfbas;
    int transflag;

    if (handle == NULL)
        return (EINVAL);

    if (!RDC_HANDLE_LIMITS(handle, fba_pos, fba_len)) {
#ifdef DEBUG
        cmn_err(CE_NOTE, "!rdc_net_read: handle bounds");
#endif
        return (EINVAL);
    }

    krdc = &rdc_k_info[local_index];
    urdc = &rdc_u_info[local_index];

    maxfbas = MAX_RDC_FBAS;

    if (krdc->remote_fd && !(rdc_get_vflags(urdc) & RDC_FCAL_FAILED)) {
        nsc_buf_t *remote_h = NULL;
        int reserved = 0;

        ret = nsc_reserve(krdc->remote_fd, NSC_MULTI);
        if (RDC_SUCCESS(ret)) {
            reserved = 1;
            ret = nsc_alloc_buf(krdc->remote_fd, fba_pos, fba_len,
                NSC_RDBUF, &remote_h);
        }
        if (RDC_SUCCESS(ret)) {
            ret = nsc_copy(remote_h, handle, fba_pos, fba_pos,
                fba_len);
            if (RDC_SUCCESS(ret)) {
                (void) nsc_free_buf(remote_h);
                nsc_release(krdc->remote_fd);
                return (0);
            }
        }
        rdc_group_enter(krdc);
        rdc_set_flags(urdc, RDC_FCAL_FAILED);
        rdc_group_exit(krdc);
        if (remote_h)
            (void) nsc_free_buf(remote_h);
        if (reserved)
            nsc_release(krdc->remote_fd);
    }

    t.tv_sec = rdc_rpc_tmout;
    t.tv_usec = 0;

    if (rdc_get_vflags(urdc) & RDC_VOL_FAILED)
        rpc_flag = RDC_RREAD_FAIL;
    else
        rpc_flag = 0;

#ifdef DEBUG
    if (krdc->intf == NULL)
        cmn_err(CE_WARN,
            "!rdc_net_read: null intf for index %d", local_index);
#endif
    /*
     * switch on proto version.
     */
    len = fba_len;      /* length (FBAs) still to xfer */
    rr.rr_bufsize = 0;  /* rpc data buffer length (bytes) */
    rr.rr_data = NULL;  /* rpc data buffer */
    transflag = rpc_flag | RDC_RREAD_START; /* setup rpc */
    if (krdc->rpc_version <= RDC_VERSION5) {
        ASSERT(fba_pos <= INT32_MAX);
        list.pos = (int)fba_pos; /* fba position of start of chunk */
        list.cd = remote_index; /* remote end cd */
        /* send setup rpc */
        list.flag = transflag;
        ASSERT(len <= INT32_MAX);
        list.len = (int)len;            /* total fba length */
        err = rdc_clnt_call(krdc->lsrv, RDCPROC_READ5,
            krdc->rpc_version, xdr_rread, (char *)&list, xdr_int,
            (char *)&ret, &t);

    } else {
        list6.pos = fba_pos;    /* fba position of start of chunk */
        list6.cd = remote_index;    /* remote end cd */
        /* send setup rpc */
        list6.flag = transflag; /* setup rpc */
        ASSERT(len <= INT32_MAX);
        list6.len = (int)len;           /* total fba length */
        err = rdc_clnt_call(krdc->lsrv, RDCPROC_READ6,
            krdc->rpc_version, xdr_rread6, (char *)&list6, xdr_int,
            (char *)&ret, &t);
    }

    if (err) {
#ifdef DEBUG
        cmn_err(CE_NOTE, "!rdc_net_read: setup err %d", err);
#endif
        if (err == RPC_INTR)
            ret = EINTR;
        else
            ret = ENOLINK;

        goto remote_rerror;
    }

    if (ret == 0) {     /* No valid index from r_net_read */
#ifdef DEBUG
        cmn_err(CE_NOTE,
            "!rdc_net_read: no valid index from r_net_read");
#endif
        return (ENOBUFS);
    }
    transflag = rpc_flag | RDC_RREAD_DATA;
    if (krdc->rpc_version <= RDC_VERSION5) {
        list.idx = ret;     /* save idx to return to server */
        list.flag = transflag;
                    /* move onto to data xfer rpcs */
    } else {
        list6.idx = ret;    /* save idx to return to server */
        list6.flag = transflag;
    }

    /* find starting position in handle */

    vec = handle->sb_vec;

    fba_pos -= handle->sb_pos;

    for (; fba_pos >= FBA_NUM(vec->sv_len); vec++)
        fba_pos -= FBA_NUM(vec->sv_len);

    sv_addr = vec->sv_addr + FBA_SIZE(fba_pos); /* data in vector */
    sv_len = vec->sv_len - FBA_SIZE(fba_pos);   /* bytes in vector */

    while (len) {
        nsc_size_t translen;
        if (len > maxfbas) {
            translen = maxfbas;
        } else {
            translen = len;
        }

        if (FBA_SIZE(translen) > sv_len) {
            translen = FBA_NUM(sv_len);
        }

        len -= translen;
        if (len == 0) {
            /* last data xfer rpc - tell server to cleanup */
            transflag |= RDC_RREAD_END;
        }

        if (!rr.rr_data || (nsc_size_t)rr.rr_bufsize !=
            FBA_SIZE(translen)) {
            if (rr.rr_data)
                kmem_free(rr.rr_data, rr.rr_bufsize);

            ASSERT(FBA_SIZE(translen) <= INT32_MAX);
            rr.rr_bufsize = FBA_SIZE(translen);
            rr.rr_data = kmem_alloc(rr.rr_bufsize, KM_NOSLEEP);
        }

        if (!rr.rr_data) {
            /* error */
#ifdef DEBUG
            cmn_err(CE_NOTE, "!rdc_net_read: kmem_alloc failed");
#endif
            return (ENOMEM);
        }

        /* get data from remote end */

#ifdef DEBUG
        if (krdc->intf == NULL)
            cmn_err(CE_WARN,
                "!rdc_net_read: null intf for index %d",
                local_index);
#endif
        if (krdc->io_kstats) {
            mutex_enter(krdc->io_kstats->ks_lock);
            kstat_runq_enter(KSTAT_IO_PTR(krdc->io_kstats));
            mutex_exit(krdc->io_kstats->ks_lock);
        }
        /*CONSTCOND*/
        ASSERT(RDC_MAXDATA <= INT32_MAX);
        ASSERT(translen <= RDC_MAXDATA);
        if (krdc->rpc_version <= RDC_VERSION5) {
            list.len = (int)translen;
            list.flag = transflag;
            err = rdc_clnt_call(krdc->lsrv, RDCPROC_READ5,
                krdc->rpc_version, xdr_rread, (char *)&list,
                xdr_rdresult, (char *)&rr, &t);
        } else {
            list6.len = (int)translen;
            list6.flag = transflag;
            err = rdc_clnt_call(krdc->lsrv, RDCPROC_READ6,
                krdc->rpc_version, xdr_rread6, (char *)&list6,
                xdr_rdresult, (char *)&rr, &t);
        }

        if (krdc->io_kstats) {
            mutex_enter(krdc->io_kstats->ks_lock);
            kstat_runq_exit(KSTAT_IO_PTR(krdc->io_kstats));
            mutex_exit(krdc->io_kstats->ks_lock);
        }

        if (err) {
#ifdef DEBUG
            cmn_err(CE_NOTE, "!rdc_net_read: rpc err %d", err);
#endif
            if (err == RPC_INTR) {
                ret = EINTR;
            } else {
                ret = ENOLINK;
            }

            goto remote_rerror;
        }

        if (rr.rr_status != RDC_OK) {
            ret = rdc_rrstatus_decode(rr.rr_status);
            if (!ret)
                ret = EIO;

            goto remote_rerror;
        }

        /* copy into handle */

        bcopy(rr.rr_data, sv_addr, (size_t)rr.rr_bufsize);

        /* update counters */

        sv_addr += rr.rr_bufsize;
        if (krdc->rpc_version <= RDC_VERSION5) {
            list.pos += translen;
        } else {
            list6.pos += translen;
        }
        if (krdc->io_kstats) {
            KSTAT_IO_PTR(krdc->io_kstats)->reads++;
            KSTAT_IO_PTR(krdc->io_kstats)->nread += rr.rr_bufsize;
        }
        ASSERT(sv_len <= INT32_MAX);
        ASSERT(sv_len >= (nsc_size_t)rr.rr_bufsize);
        sv_len -= rr.rr_bufsize;

        if (sv_len == 0) {
            /* goto next vector */
            vec++;
            sv_addr = vec->sv_addr;
            sv_len = vec->sv_len;
        }
    }

    if (rr.rr_data)
        kmem_free(rr.rr_data, rr.rr_bufsize);

    return (0);

remote_rerror:
    if (rr.rr_data)
        kmem_free(rr.rr_data, rr.rr_bufsize);

    return (ret ? ret : ENOLINK);
}

/*
 * rdc_net_write
 * Main remote write client side
 * Handles protocol selection as well as requests for remote allocation
 * and data transfer
 * Does local IO for FCAL
 * caller must clear bitmap on success
 */

int
rdc_net_write(int local_index, int remote_index, nsc_buf_t *handle,
    nsc_off_t fba_pos, nsc_size_t fba_len, uint_t aseq, int qpos,
    netwriteres *netres)
{
    rdc_k_info_t *krdc;
    rdc_u_info_t *urdc;
    struct timeval t;
    nsc_vec_t *vec;
    int sv_len;
    nsc_off_t fpos;
    int err;
    struct netwriteres netret;
    struct netwriteres *netresptr;
    struct net_data5 dlist5;
    struct net_data6 dlist6;
    int ret;
    nsc_size_t maxfbas;
    int transflag;
    int translen;
    int transendoblk;
    char *transptr;
    int vflags;

    if (handle == NULL)
        return (EINVAL);

    /* if not a diskq buffer */
    if ((qpos == -1) && (!RDC_HANDLE_LIMITS(handle, fba_pos, fba_len))) {
#ifdef DEBUG
        cmn_err(CE_NOTE, "!rdc_net_write: handle bounds");
#endif
        return (EINVAL);
    }


    t.tv_sec = rdc_rpc_tmout;
    t.tv_usec = 0;

    krdc = &rdc_k_info[local_index];
    urdc = &rdc_u_info[local_index];

    maxfbas = MAX_RDC_FBAS;

    /* FCAL IO */
    if (krdc->remote_fd && !(rdc_get_vflags(urdc) & RDC_FCAL_FAILED)) {
        nsc_buf_t *remote_h = NULL;
        int reserved = 0;

        ret = nsc_reserve(krdc->remote_fd, NSC_MULTI);
        if (RDC_SUCCESS(ret)) {
            reserved = 1;
            ret = nsc_alloc_buf(krdc->remote_fd, fba_pos, fba_len,
                NSC_WRBUF, &remote_h);
        }
        if (RDC_SUCCESS(ret)) {
            ret = nsc_copy(handle, remote_h, fba_pos, fba_pos,
                fba_len);
            if (RDC_SUCCESS(ret))
                ret = nsc_write(remote_h, fba_pos, fba_len, 0);
            if (RDC_SUCCESS(ret)) {
                (void) nsc_free_buf(remote_h);
                nsc_release(krdc->remote_fd);
                return (0);
            }
        }
        rdc_group_enter(krdc);
        rdc_set_flags(urdc, RDC_FCAL_FAILED);
        rdc_group_exit(krdc);
        if (remote_h)
            (void) nsc_free_buf(remote_h);
        if (reserved)
            nsc_release(krdc->remote_fd);
    }

    /*
     * At this point we must decide which protocol we are using and
     * do the right thing
     */
    netret.vecdata.vecdata_val = NULL;
    netret.vecdata.vecdata_len = 0;
    if (netres) {
        netresptr = netres;
    } else {
        netresptr = &netret;
    }

    vflags = rdc_get_vflags(urdc);

    if (vflags & (RDC_VOL_FAILED|RDC_BMP_FAILED))
        transflag = RDC_RWRITE_FAIL;
    else
        transflag = 0;


#ifdef DEBUG
    if (krdc->intf == NULL)
        cmn_err(CE_WARN, "!rdc_net_write: null intf for index %d",
            local_index);
#endif

    vec = handle->sb_vec;

    /*
     * find starting position in vector
     */
    if ((qpos == -1) || (handle->sb_user == RDC_NULLBUFREAD))
        fpos = fba_pos - handle->sb_pos;
    else
        fpos = (qpos + 1) - handle->sb_pos;

    for (; fpos >= FBA_NUM(vec->sv_len); vec++)
        fpos -= FBA_NUM(vec->sv_len);
    sv_len = vec->sv_len - FBA_SIZE(fpos);  /* bytes in vector */
    transptr = (char *)vec->sv_addr + FBA_SIZE(fpos);

    if (krdc->rpc_version <= RDC_VERSION5) {
        dlist5.local_cd = local_index;
        dlist5.cd = remote_index;
        ASSERT(fba_len <= INT32_MAX);
        ASSERT(fba_pos <= INT32_MAX);
        dlist5.len = (int)fba_len;
        dlist5.pos = (int)fba_pos;
        dlist5.idx = -1; /* Starting index */
        dlist5.flag = transflag;
        dlist5.seq = aseq;      /* sequence number */
        dlist5.sfba = (int)fba_pos; /* starting fba for this xfer */
    } else {
        dlist6.local_cd = local_index;
        dlist6.cd = remote_index;
        ASSERT(fba_len <= INT32_MAX);
        dlist6.len = (int)fba_len;
        dlist6.qpos = qpos;
        dlist6.pos = fba_pos;
        dlist6.idx = -1; /* Starting index */
        dlist6.flag = transflag;
        dlist6.seq = aseq;      /* sequence number */
        dlist6.sfba = fba_pos;      /* starting fba for this xfer */
    }

    transendoblk = 0;
    while (fba_len) {
        if (!transptr) {
#ifdef DEBUG
            cmn_err(CE_WARN,
                "!rdc_net_write: walked off end of handle!");
#endif
            ret = EINVAL;
            goto remote_error;
        }

        if (fba_len > maxfbas) {
            ASSERT(maxfbas <= INT32_MAX);
            translen = (int)maxfbas;
        } else {
            ASSERT(fba_len <= INT32_MAX);
            translen = (int)fba_len;
        }

        if (FBA_SIZE(translen) > sv_len) {
            translen = FBA_NUM(sv_len);
        }

        fba_len -= translen;
        if (fba_len == 0) {
            /* last data xfer - tell server to commit */
            transendoblk = 1;
        }


#ifdef DEBUG
        if (krdc->intf == NULL)
            cmn_err(CE_WARN,
                "!rdc_net_write: null intf for index %d",
                local_index);
#endif
        DTRACE_PROBE(rdc_netwrite_clntcall_start);

        if (krdc->io_kstats) {
            mutex_enter(krdc->io_kstats->ks_lock);
            kstat_runq_enter(KSTAT_IO_PTR(krdc->io_kstats));
            mutex_exit(krdc->io_kstats->ks_lock);
        }
        if (krdc->rpc_version <= RDC_VERSION5) {
            ret = 0;
            dlist5.nfba = translen;
            dlist5.endoblk = transendoblk;
            dlist5.data.data_len = FBA_SIZE(translen);
            dlist5.data.data_val = transptr;
            err = rdc_clnt_call(krdc->lsrv, RDCPROC_WRITE5,
                krdc->rpc_version, xdr_net_data5,
                (char *)&dlist5, xdr_int,
                (char *)&ret, &t);
            if (ret >= 0) {
                netresptr->result = 0;
                netresptr->index = ret;
            } else {
                netresptr->result = ret;
            }
        } else {
            netresptr->result = 0;
            dlist6.nfba = translen;
            dlist6.endoblk = transendoblk;
            dlist6.data.data_len = FBA_SIZE(translen);
            dlist6.data.data_val = transptr;
            err = rdc_clnt_call(krdc->lsrv, RDCPROC_WRITE6,
                krdc->rpc_version, xdr_net_data6,
                (char *)&dlist6, xdr_netwriteres,
                (char *)netresptr, &t);
        }

        if (krdc->io_kstats) {
            mutex_enter(krdc->io_kstats->ks_lock);
            kstat_runq_exit(KSTAT_IO_PTR(krdc->io_kstats));
            mutex_exit(krdc->io_kstats->ks_lock);
        }

        DTRACE_PROBE(rdc_netwrite_clntcall_end);
        ret = netresptr->result;
        if (err) {
            if (err == RPC_INTR)
                ret = EINTR;
            else if (err && ret != EPROTO)
                ret = ENOLINK;
#ifdef DEBUG
            cmn_err(CE_NOTE,
                "!rdc_net_write(5): cd %d err %d ret %d",
                remote_index, err, ret);
#endif
            goto remote_error;
        }
        /* Error from r_net_write5 */
        if (netresptr->result < 0) {
#ifdef DEBUG
            cmn_err(CE_NOTE,
                "!rdc_net_write: r_net_write(5) "
                "returned: %d",
                -netresptr->result);
#endif
            ret = -netresptr->result;
            if (netret.vecdata.vecdata_val)
                kmem_free(netret.vecdata.vecdata_val,
                    netret.vecdata.vecdata_len *
                    sizeof (net_pendvec_t));
            goto remote_error;
        } else if (netresptr->index == 0) {
#ifdef DEBUG
            cmn_err(CE_NOTE,
                "!rdc_net_write: no valid index from "
                "r_net_write(5)");
#endif
            ret = ENOBUFS;
            if (netret.vecdata.vecdata_val)
                kmem_free(netret.vecdata.vecdata_val,
                    netret.vecdata.vecdata_len *
                    sizeof (net_pendvec_t));
            goto remote_error;
        }
        if (krdc->rpc_version <= RDC_VERSION5) {
            dlist5.idx = netresptr->index;
            dlist5.sfba += dlist5.nfba;
        } else {
            dlist6.idx = netresptr->index;
            dlist6.sfba += dlist6.nfba;
        }
        /* update counters */
        if (krdc->io_kstats) {
            KSTAT_IO_PTR(krdc->io_kstats)->writes++;
            KSTAT_IO_PTR(krdc->io_kstats)->nwritten +=
                FBA_SIZE(translen);
        }
        transptr += FBA_SIZE(translen);
        sv_len -= FBA_SIZE(translen);

        if (sv_len <= 0) {
            /* goto next vector */
            vec++;
            transptr = (char *)vec->sv_addr;
            sv_len = vec->sv_len;
        }
    }
    /*
     * this can't happen.....
     */
    if (netret.vecdata.vecdata_val)
        kmem_free(netret.vecdata.vecdata_val,
            netret.vecdata.vecdata_len *
            sizeof (net_pendvec_t));

    return (0);

remote_error:
    return (ret ? ret : ENOLINK);
}

void
rdc_fixlen(rdc_aio_t *aio)
{
    nsc_vec_t *vecp = aio->qhandle->sb_vec;
    nsc_size_t len = 0;

    while (vecp->sv_addr) {
        len += FBA_NUM(vecp->sv_len);
        vecp++;
    }
    aio->qhandle->sb_len = len;
}

/*
 * rdc_dump_alloc_bufs_cd
 * Dump allocated buffers (rdc_net_hnd's) for the specified cd.
 * this could be the flusher failing, if so, don't do the delay forever
 * Returns: 0 (success), EAGAIN (caller needs to try again).
 */
int
rdc_dump_alloc_bufs_cd(int index)
{
    rdc_k_info_t *krdc;
    rdc_aio_t *aio;
    net_queue *q;
    disk_queue *dq;
    kmutex_t *qlock;

    krdc = &rdc_k_info[index];


    if (!krdc->c_fd) {
        /* cannot do anything! */
#ifdef DEBUG
        cmn_err(CE_WARN, "!rdc_dump_alloc_bufs_cd(%d): c_fd NULL",
            index);
#endif
        return (0);
    }
    rdc_dump_dsets(index);

    dq = &krdc->group->diskq;

    if (RDC_IS_DISKQ(krdc->group)) {
        qlock = QLOCK(dq);
        (void) _rdc_rsrv_diskq(krdc->group);
    } else {
        qlock = &krdc->group->ra_queue.net_qlock;
    }

    /*
     * Now dump the async queue anonymous buffers
     * if we are a diskq, the we are using the diskq mutex.
     * However, we are flushing from diskq to memory queue
     * so we now need to grab the memory lock also
     */

    q = &krdc->group->ra_queue;

    if (RDC_IS_DISKQ(krdc->group)) {
        mutex_enter(&q->net_qlock);
        if (q->qfill_sleeping == RDC_QFILL_AWAKE) {
            int tries = 5;
#ifdef DEBUG_DISKQ
            cmn_err(CE_NOTE,
                "!dumpalloccd sending diskq->memq flush to sleep");
#endif
            q->qfflags |= RDC_QFILLSLEEP;
            mutex_exit(&q->net_qlock);

            while (q->qfill_sleeping == RDC_QFILL_AWAKE && tries--)
                delay(5);
            mutex_enter(&q->net_qlock);
        }
    }

    mutex_enter(qlock);

    while ((q->net_qhead != NULL)) {
        rdc_k_info_t *tmpkrdc;
        aio = q->net_qhead;
        tmpkrdc = &rdc_k_info[aio->index];

        if (RDC_IS_DISKQ(krdc->group)) {
            aio->qhandle->sb_user--;
            if (aio->qhandle->sb_user == 0) {
                rdc_fixlen(aio);
                (void) nsc_free_buf(aio->qhandle);
                aio->qhandle = NULL;
                aio->handle = NULL;
            }
        } else {
            if (aio->handle) {
                (void) nsc_free_buf(aio->handle);
                aio->handle = NULL;
            }
        }

        if (tmpkrdc->io_kstats && !RDC_IS_DISKQ(krdc->group)) {
            mutex_enter(tmpkrdc->io_kstats->ks_lock);
            kstat_waitq_exit(KSTAT_IO_PTR(tmpkrdc->io_kstats));
            mutex_exit(tmpkrdc->io_kstats->ks_lock);
        }
        q->net_qhead = q->net_qhead->next;
        q->blocks -= aio->len;
        q->nitems--;

        RDC_CHECK_BIT(tmpkrdc, aio->pos, aio->len);

        kmem_free(aio, sizeof (*aio));
    }
    q->net_qtail = NULL;

    if (krdc->group->asyncstall) {
        krdc->group->asyncdis = 1;
        cv_broadcast(&krdc->group->asyncqcv);
    }
    if (krdc->group->sleepq) {
        rdc_sleepqdiscard(krdc->group);
    }

    krdc->group->seq = RDC_NEWSEQ;
    krdc->group->seqack = RDC_NEWSEQ;
    if (RDC_IS_DISKQ(krdc->group)) {
        rdc_dump_iohdrs(dq);
        SET_QNXTIO(dq, QHEAD(dq));
        SET_QCOALBOUNDS(dq, QHEAD(dq));
    }
    mutex_exit(qlock);

    if (RDC_IS_DISKQ(krdc->group)) {
        mutex_exit(&q->net_qlock);
        _rdc_rlse_diskq(krdc->group);
    }

    return (0);
}


/*
 * rdc_dump_alloc_bufs
 * We have an error on the link
 * Try to dump all of the allocated bufs so we can cleanly recover
 * and not hang
 */
void
rdc_dump_alloc_bufs(rdc_if_t *ip)
{
    rdc_k_info_t *krdc;
    int repeat;
    int index;

    for (index = 0; index < rdc_max_sets; index++) {
        do {
            krdc = &rdc_k_info[index];
            repeat = 0;
            if (krdc->intf == ip) {
                if (rdc_dump_alloc_bufs_cd(index) == EAGAIN) {
                    repeat = 1;
                    delay(2);
                }
            }
        } while (repeat);
    }
}

/*
 * returns 1 if the the throttle should throttle, 0 if not.
 */
int
_rdc_diskq_isfull(disk_queue *q, long len)
{
    /* ---T----H----N--- */
    mutex_enter(QLOCK(q));

    if (FITSONQ(q, len + 1)) {
        mutex_exit(QLOCK(q));
        return (0);
    }
    mutex_exit(QLOCK(q));
    return (1);
}

void
_rdc_async_throttle(rdc_k_info_t *this, long len)
{
    rdc_k_info_t *krdc;
    rdc_u_info_t *urdc;
    int print_msg = 1;
    int tries = RDC_FUTILE_ATTEMPTS;

    /*
     * Throttle entries on queue
     */

    /* Need to take the 1-many case into account, checking all sets */

    /* ADD HANDY HUERISTIC HERE TO SLOW DOWN IO */
    for (krdc = this; /* CSTYLED */; krdc = krdc->many_next) {
        urdc = &rdc_u_info[krdc->index];

        /*
         * this may be the last set standing in a one to many setup.
         * we may also be stuck in unintercept, after marking
         * the volume as not enabled, but have not removed it
         * from the many list resulting in an endless loop if
         * we just continue here. Lets jump over this stuff
         * and check to see if we are the only dude here.
         */
        if (!IS_ENABLED(urdc))
            goto thischeck;

        if (IS_ASYNC(urdc) && RDC_IS_MEMQ(krdc->group)) {
            net_queue *q = &krdc->group->ra_queue;
            while ((q->blocks + q->inflbls) > urdc->maxqfbas ||
                (q->nitems + q->inflitems) > urdc->maxqitems) {

                if (!IS_ENABLED(urdc)) /* disable race */
                    goto thischeck;

                if (!krdc->group->rdc_writer)
                    (void) rdc_writer(krdc->index);
                delay(2);
                q->throttle_delay++;
            }
        }

        /* do a much more aggressive delay, get disk flush going */
        if (IS_ASYNC(urdc) && RDC_IS_DISKQ(krdc->group)) {
            disk_queue *q = &krdc->group->diskq;
            while ((!IS_QSTATE(q, RDC_QNOBLOCK)) &&
                (_rdc_diskq_isfull(q, len)) &&
                (!IS_STATE(urdc, RDC_DISKQ_FAILED))) {
                if (print_msg) {
                    cmn_err(CE_WARN, "!rdc async throttle:"
                        " disk queue %s full",
                        &urdc->disk_queue[0]);

                    print_msg = 0;
                }
                if (!IS_ENABLED(urdc)) /* disable race */
                    goto thischeck;

                if (!krdc->group->rdc_writer)
                    (void) rdc_writer(krdc->index);
                delay(10);
                q->throttle_delay += 10;

                if (!(tries--) && IS_STATE(urdc, RDC_QUEUING)) {
                    cmn_err(CE_WARN, "!SNDR: disk queue "
                        "%s full & not flushing. giving up",
                        &urdc->disk_queue[0]);
                    cmn_err(CE_WARN, "!SNDR: %s:%s entering"
                        " logging mode",
                        urdc->secondary.intf,
                        urdc->secondary.file);
                    rdc_fail_diskq(krdc, RDC_WAIT,
                        RDC_DOLOG | RDC_NOFAIL);
                    mutex_enter(QLOCK(q));
                    cv_broadcast(&q->qfullcv);
                    mutex_exit(QLOCK(q));
                }

            }
            if ((IS_QSTATE(q, RDC_QNOBLOCK)) &&
                _rdc_diskq_isfull(q, len) &&
                !IS_STATE(urdc, RDC_DISKQ_FAILED)) {
                if (print_msg) {
                    cmn_err(CE_WARN, "!disk queue %s full",
                        &urdc->disk_queue[0]);
                    print_msg = 0;
                }
                rdc_fail_diskq(krdc, RDC_WAIT,
                    RDC_DOLOG | RDC_NOFAIL);
                mutex_enter(QLOCK(q));
                cv_broadcast(&q->qfullcv);
                mutex_exit(QLOCK(q));
            }
        }

thischeck:
        if (krdc->many_next == this)
            break;
    }
}

int rdc_coalesce = 1;
static int rdc_joins = 0;

int
rdc_aio_coalesce(rdc_aio_t *queued, rdc_aio_t *new)
{
    nsc_buf_t *h = NULL;
    int rc;
    rdc_k_info_t *krdc;
    uint_t bitmask;

    if (rdc_coalesce == 0)
        return (0);     /* don't even try */

    if ((queued == NULL) ||
        (queued->handle == NULL) ||
        (new->handle == NULL)) {
        return (0);     /* existing queue is empty */
    }
    if (queued->index != new->index || queued->len + new->len >
        MAX_RDC_FBAS) {
        return (0);     /* I/O to big */
    }
    if ((queued->pos + queued->len == new->pos) ||
        (new->pos + new->len == queued->pos)) {
        rc = nsc_alloc_abuf(queued->pos, queued->len + new->len, 0,
            &h);
        if (!RDC_SUCCESS(rc)) {
            if (h != NULL)
                (void) nsc_free_buf(h);
            return (0);     /* couldn't do coalesce */
        }
        rc = nsc_copy(queued->handle, h, queued->pos, queued->pos,
            queued->len);
        if (!RDC_SUCCESS(rc)) {
            (void) nsc_free_buf(h);
            return (0);     /* couldn't do coalesce */
        }
        rc = nsc_copy(new->handle, h, new->pos, new->pos,
            new->len);
        if (!RDC_SUCCESS(rc)) {
            (void) nsc_free_buf(h);
            return (0);     /* couldn't do coalesce */
        }

        krdc = &rdc_k_info[queued->index];

        RDC_SET_BITMASK(queued->pos, queued->len, &bitmask);
        RDC_CLR_BITMAP(krdc, queued->pos, queued->len, \
            bitmask, RDC_BIT_BUMP);

        RDC_SET_BITMASK(new->pos, new->len, &bitmask);
        RDC_CLR_BITMAP(krdc, new->pos, new->len, \
            bitmask, RDC_BIT_BUMP);

        (void) nsc_free_buf(queued->handle);
        (void) nsc_free_buf(new->handle);
        queued->handle = h;
        queued->len += new->len;
        bitmask = 0;
        /*
         * bump the ref count back up
         */

        RDC_SET_BITMAP(krdc, queued->pos, queued->len, &bitmask);
        return (1); /* new I/O succeeds last I/O queued */
    }
    return (0);
}

int
rdc_memq_enqueue(rdc_k_info_t *krdc, rdc_aio_t *aio)
{
    net_queue *q;
    rdc_group_t *group;

    group = krdc->group;
    q = &group->ra_queue;

    mutex_enter(&q->net_qlock);

    if (rdc_aio_coalesce(q->net_qtail, aio)) {
        rdc_joins++;
        q->blocks += aio->len;
        kmem_free(aio, sizeof (*aio));
        goto out;
    }
    aio->seq = group->seq++;
    if (group->seq < aio->seq)
        group->seq = RDC_NEWSEQ + 1; /* skip magics */

    if (q->net_qhead == NULL) {
        /* adding to empty q */
        q->net_qhead = q->net_qtail = aio;

#ifdef DEBUG
        if (q->blocks != 0 || q->nitems != 0) {
            cmn_err(CE_PANIC,
                "rdc enqueue: q %p, qhead 0, q blocks %" NSC_SZFMT
                ", nitems %" NSC_SZFMT,
                (void *) q, q->blocks, q->nitems);
        }
#endif

    } else {
        /* discontiguous, add aio to q tail */
        q->net_qtail->next = aio;
        q->net_qtail = aio;
    }

    q->blocks += aio->len;
    q->nitems++;

    if (krdc->io_kstats) {
        mutex_enter(krdc->io_kstats->ks_lock);
        kstat_waitq_enter(KSTAT_IO_PTR(krdc->io_kstats));
        mutex_exit(krdc->io_kstats->ks_lock);
    }
out:
#ifdef DEBUG
    /* sum the q and check for sanity */
    {
        nsc_size_t qblocks = 0;
        uint64_t nitems = 0;
        rdc_aio_t *a;

        for (a = q->net_qhead; a != NULL; a = a->next) {
            qblocks += a->len;
            nitems++;
        }

        if (qblocks != q->blocks || nitems != q->nitems) {
            cmn_err(CE_PANIC,
                "rdc enqueue: q %p, q blocks %" NSC_SZFMT " (%"
                NSC_SZFMT "), nitems %" NSC_SZFMT " (%"
                NSC_SZFMT ")", (void *) q, q->blocks, qblocks,
                q->nitems, nitems);
        }
    }
#endif

    mutex_exit(&q->net_qlock);

    if (q->nitems > q->nitems_hwm) {
        q->nitems_hwm = q->nitems;
    }

    if (q->blocks > q->blocks_hwm) {
        q->blocks_hwm = q->blocks;
    }

    if (!krdc->group->rdc_writer)
        (void) rdc_writer(krdc->index);

    return (0);
}

int
_rdc_enqueue_write(rdc_k_info_t *krdc, nsc_off_t pos, nsc_size_t len, int flag,
    nsc_buf_t *h)
{
    rdc_aio_t *aio;
    rdc_group_t *group;
    rdc_u_info_t *urdc = &rdc_u_info[krdc->index];
    int rc;

    aio = kmem_zalloc(sizeof (*aio), KM_NOSLEEP);
    if (!aio) {
        return (ENOMEM);
    }

    group = krdc->group;

    aio->pos = pos;
    aio->qpos = -1;
    aio->len = len;
    aio->flag = flag;
    aio->index = krdc->index;
    aio->handle = h;

    if (group->flags & RDC_MEMQUE) {
        return (rdc_memq_enqueue(krdc, aio));
    } else if ((group->flags & RDC_DISKQUE) &&
        !IS_STATE(urdc, RDC_DISKQ_FAILED)) {
        rc = rdc_diskq_enqueue(krdc, aio);
        kmem_free(aio, sizeof (*aio));
        return (rc);
    }
    return (-1); /* keep lint quiet */
}


/*
 * Async Network RDC flusher
 */

/*
 * don't allow any new writer threads to start if a member of the set
 * is disable pending
 */
int
is_disable_pending(rdc_k_info_t *krdc)
{
    rdc_k_info_t *this = krdc;
    int rc = 0;

    do {
        if (krdc->type_flag & RDC_DISABLEPEND) {
            krdc = this;
            rc = 1;
            break;
        }
        krdc = krdc->group_next;

    } while (krdc != this);

    return (rc);
}

/*
 * rdc_writer -- spawn new writer if not running already
 *  called after enqueing the dirty blocks
 */
int
rdc_writer(int index)
{
    rdc_k_info_t *krdc = &rdc_k_info[index];
    nsthread_t *t;
    rdc_group_t *group;
    kmutex_t    *qlock;
    int tries;
    const int MAX_TRIES = 16;

    group = krdc->group;

    if (RDC_IS_DISKQ(group))
        qlock = &group->diskq.disk_qlock;
    else
        qlock = &group->ra_queue.net_qlock;

    mutex_enter(qlock);

#ifdef DEBUG
    if (noflush) {
        mutex_exit(qlock);
        return (0);
    }
#endif

    if ((group->rdc_writer) || is_disable_pending(krdc)) {
        mutex_exit(qlock);
        return (0);
    }

    if ((group->rdc_thrnum >= 1) && (group->seqack == RDC_NEWSEQ)) {
        /*
         * We also need to check if we are starting a new
         * sequence, and if so don't create a new thread,
         * as we must ensure that the start of new sequence
         * requests arrives first to re-init the server.
         */
        mutex_exit(qlock);
        return (0);
    }
    /*
     * For version 6,
     * see if we can fit in another thread.
     */
    group->rdc_thrnum++;

    if (krdc->intf && (krdc->intf->rpc_version >= RDC_VERSION6)) {
        rdc_u_info_t *urdc = &rdc_u_info[index];
        if (group->rdc_thrnum >= urdc->asyncthr)
            group->rdc_writer = 1;
    } else {
        group->rdc_writer = 1;
    }

    mutex_exit(qlock);


    /*
     * If we got here, we know that we have not exceeded the allowed
     * number of async threads for our group.  If we run out of threads
     * in _rdc_flset, we add a new thread to the set.
     */
    tries = 0;
    do {
        /* first try to grab a thread from the free list */
        if (t = nst_create(_rdc_flset, rdc_flusher_thread,
            (blind_t)(unsigned long)index, 0)) {
            break;
        }

        /* that failed; add a thread to the set and try again */
        if (nst_add_thread(_rdc_flset, 1) != 1) {
            cmn_err(CE_WARN, "!rdc_writer index %d nst_add_thread "
                "error, tries: %d", index, tries);
            break;
        }
    } while (++tries < MAX_TRIES);

    if (tries) {
        mutex_enter(&group->addthrnumlk);
        group->rdc_addthrnum += tries;
        mutex_exit(&group->addthrnumlk);
    }

    if (t) {
        return (1);
    }

    cmn_err(CE_WARN, "!rdc_writer: index %d nst_create error", index);
    rdc_many_enter(krdc);
    mutex_enter(qlock);
    group->rdc_thrnum--;
    group->rdc_writer = 0;
    if ((group->count == 0) && (group->rdc_thrnum == 0)) {
        mutex_exit(qlock);
        /*
         * Race with remove_from_group while write thread was
         * failing to be created.
         */
#ifdef DEBUG
        cmn_err(CE_WARN, "!rdc_writer: group being destroyed");
#endif
        rdc_delgroup(group);
        krdc->group = NULL;
        rdc_many_exit(krdc);
        return (-1);
    }
    mutex_exit(qlock);
    rdc_many_exit(krdc);
    return (-1);
}

/*
 * Either we need to flush the
 * kmem (net_queue) queue or the disk (disk_queue)
 * determine which, and do it.
 */
void
rdc_flusher_thread(int index)
{
    rdc_k_info_t *krdc = &rdc_k_info[index];

    if (krdc->group->flags & RDC_MEMQUE) {
        rdc_flush_memq(index);
        return;
    } else if (krdc->group->flags & RDC_DISKQUE) {
        rdc_flush_diskq(index);
        return;
    } else { /* uh-oh, big time */
        cmn_err(CE_PANIC, "flusher trying to flush unknown queue type");
    }

}

void
rdc_flush_memq(int index)
{
    rdc_k_info_t *krdc = &rdc_k_info[index];
    rdc_aio_t *aio;
    net_queue *q;
    int dowork;
    rdc_group_t *group = krdc->group;
    if (!group || group->count == 0) {
#ifdef DEBUG
        cmn_err(CE_WARN, "!rdc_flush_memq: no group left!");
#endif
        return;
    }

    if (!krdc->c_fd) {
#ifdef DEBUG
        cmn_err(CE_WARN, "!rdc_flush_memq: no c_fd!");
#endif
        goto thread_death;
    }

#ifdef DEBUG_DISABLE
    if (index < 0 || (krdc->type_flag & RDC_DISABLEPEND)) {
        cmn_err(CE_WARN, "!rdc_flush_memq: DISABLE PENDING!");
        /*
         * Need to continue as we may be trying to flush IO
         * while trying to disable or suspend
         */
    }
#endif

    q = &group->ra_queue;

    dowork = 1;
    /* CONSTCOND */
    while (dowork) {
        if (net_exit == ATM_EXIT)
            break;

        group = krdc->group;
        if (!group || group->count == 0) {
#ifdef DEBUG
            cmn_err(CE_WARN, "!rdc_flush_memq: no group left!");
#endif
            break;
        }

        mutex_enter(&q->net_qlock);
        aio = q->net_qhead;

        if (aio == NULL) {
#ifdef DEBUG
            if (q->nitems != 0 ||
                q->blocks != 0 ||
                q->net_qtail != 0) {
                cmn_err(CE_PANIC,
                    "rdc_flush_memq(1): q %p, q blocks %"
                    NSC_SZFMT ", nitems %" NSC_SZFMT
                    ", qhead %p qtail %p",
                    (void *) q, q->blocks, q->nitems,
                    (void *) aio, (void *) q->net_qtail);
            }
#endif
            mutex_exit(&q->net_qlock);
            break;
        }

        /* aio remove from q */

        q->net_qhead = aio->next;
        aio->next = NULL;

        if (q->net_qtail == aio)
            q->net_qtail = q->net_qhead;

        q->blocks -= aio->len;
        q->nitems--;

        /*
         * in flight numbers.
         */
        q->inflbls += aio->len;
        q->inflitems++;

#ifdef DEBUG
        if (q->net_qhead == NULL) {
            if (q->nitems != 0 ||
                q->blocks != 0 ||
                q->net_qtail != 0) {
                cmn_err(CE_PANIC,
                    "rdc_flush_memq(2): q %p, q blocks %"
                    NSC_SZFMT ", nitems %" NSC_SZFMT
                    ", qhead %p qtail %p",
                    (void *) q, q->blocks, q->nitems,
                    (void *) q->net_qhead,
                    (void *) q->net_qtail);
            }
        }

#ifndef NSC_MULTI_TERABYTE
        if (q->blocks < 0) {
            cmn_err(CE_PANIC,
                "rdc_flush_memq(3): q %p, q blocks %" NSC_SZFMT
                ", nitems %d, qhead %p, qtail %p",
                (void *) q, q->blocks, q->nitems,
                (void *) q->net_qhead, (void *) q->net_qtail);
        }
#else
        /* blocks and nitems are unsigned for NSC_MULTI_TERABYTE */
#endif
#endif

        mutex_exit(&q->net_qlock);

        aio->iostatus = RDC_IO_INIT;

        _rdc_remote_flush(aio);

        mutex_enter(&q->net_qlock);
        q->inflbls -= aio->len;
        q->inflitems--;
        if ((group->seqack == RDC_NEWSEQ) &&
            (group->seq != RDC_NEWSEQ + 1)) {
            if ((q->net_qhead == NULL) ||
                (q->net_qhead->seq != RDC_NEWSEQ + 1)) {
                /*
                 * We are an old thread, and the
                 * queue sequence has been reset
                 * during the network write above.
                 * As such we mustn't pull another
                 * job from the queue until the
                 * first sequence message has been ack'ed.
                 * Just die instead. Unless this thread
                 * is the first sequence that has just
                 * been ack'ed
                 */
                dowork = 0;
            }
        }
        mutex_exit(&q->net_qlock);

        if ((aio->iostatus != RDC_IO_DONE) && (group->count)) {
            rdc_k_info_t *krdctmp = &rdc_k_info[aio->index];
            if (krdctmp->type_flag & RDC_DISABLEPEND) {
                kmem_free(aio, sizeof (*aio));
                goto thread_death;
            }
            rdc_group_enter(krdc);
            ASSERT(krdc->group);
            rdc_group_log(krdc, RDC_NOFLUSH | RDC_ALLREMOTE,
                "memq flush aio status not RDC_IO_DONE");
            rdc_group_exit(krdc);
            rdc_dump_queue(aio->index);
        }
        kmem_free(aio, sizeof (*aio));

        if (krdc->remote_index < 0 || !krdc->lsrv || !krdc->intf)
            break;
    }

thread_death:
    rdc_many_enter(krdc);
    mutex_enter(&group->ra_queue.net_qlock);
    group->rdc_thrnum--;
    group->rdc_writer = 0;
    /*
     * all threads must be dead.
     */
    if ((group->count == 0) && (group->rdc_thrnum == 0)) {
        mutex_exit(&group->ra_queue.net_qlock);
        /*
         * Group now empty, so destroy
         * Race with remove_from_group while write thread was running
         */
#ifdef DEBUG
        cmn_err(CE_WARN, "!rdc_flush_memq: group being destroyed");
#endif
        rdc_delgroup(group);
        krdc->group = NULL;
        rdc_many_exit(krdc);
        return;
    }
    mutex_exit(&group->ra_queue.net_qlock);
    rdc_many_exit(krdc);
}

/*
 * rdc_flush_diskq
 * disk queue flusher
 */
void
rdc_flush_diskq(int index)
{
    rdc_k_info_t *krdc = &rdc_k_info[index];
    rdc_u_info_t *urdc = &rdc_u_info[index];
    rdc_aio_t *aio = NULL;
    disk_queue *q;
    net_queue *nq;
    int dowork;
    int rc;
    rdc_group_t *group = krdc->group;

    if (!group || group->count == 0) {
#ifdef DEBUG
        cmn_err(CE_WARN, "!rdc_flush_diskq: no group left!");
#endif
        return;
    }

    if (!krdc->c_fd) {
#ifdef DEBUG
        cmn_err(CE_WARN, "!rdc_flush_diskq: no c_fd!");
#endif
        return;
    }

#ifdef DEBUG_DISABLE
    if (index < 0 || (krdc->type_flag & RDC_DISABLEPEND)) {
        cmn_err(CE_WARN, "!rdc_flush_diskq: DISABLE PENDING!");
        /*
         * Need to continue as we may be trying to flush IO
         * while trying to disable or suspend
         */
    }
#endif
    q = &group->diskq;
    nq = &group->ra_queue;

    if (IS_QSTATE(q, RDC_QDISABLEPEND) || IS_STATE(urdc, RDC_LOGGING)) {
#ifdef DEBUG
        cmn_err(CE_NOTE, "!flusher thread death 1 %x", QSTATE(q));
#endif
        goto thread_death;
    }

    dowork = 1;
    /* CONSTCOND */
    while (dowork) {
        if (net_exit == ATM_EXIT)
            break;

        group = krdc->group;
        if (!group || group->count == 0) {
#ifdef DEBUG
            cmn_err(CE_WARN, "!rdc_flush_diskq: no group left!");
#endif
            break;
        }

        do {
            rc = 0;
            if ((IS_STATE(urdc, RDC_LOGGING)) ||
                (IS_STATE(urdc, RDC_SYNCING)) ||
                (nq->qfflags & RDC_QFILLSLEEP))
                goto thread_death;

            aio = rdc_dequeue(krdc, &rc);

            if ((IS_STATE(urdc, RDC_LOGGING)) ||
                (IS_STATE(urdc, RDC_SYNCING)) ||
                (nq->qfflags & RDC_QFILLSLEEP)) {
                goto thread_death;
            }
            if (rc == EAGAIN) {
                delay(40);
            }

        } while (rc == EAGAIN);

        if (aio == NULL) {
            break;
        }

        aio->iostatus = RDC_IO_INIT;

        mutex_enter(QLOCK(q));
        q->inflbls += aio->len;
        q->inflitems++;
        mutex_exit(QLOCK(q));

        _rdc_remote_flush(aio);

        mutex_enter(QLOCK(q));
        q->inflbls -= aio->len;
        q->inflitems--;

        if ((group->seqack == RDC_NEWSEQ) &&
            (group->seq != RDC_NEWSEQ + 1)) {
            if ((nq->net_qhead == NULL) ||
                (nq->net_qhead->seq != RDC_NEWSEQ + 1)) {
                /*
                 * We are an old thread, and the
                 * queue sequence has been reset
                 * during the network write above.
                 * As such we mustn't pull another
                 * job from the queue until the
                 * first sequence message has been ack'ed.
                 * Just die instead. Unless of course,
                 * this thread is the first sequence that
                 * has just been ack'ed.
                 */
                dowork = 0;
            }
        }
        mutex_exit(QLOCK(q));

        if (aio->iostatus == RDC_IO_CANCELLED) {
            rdc_dump_queue(aio->index);
            kmem_free(aio, sizeof (*aio));
            aio = NULL;
            if (group) { /* seq gets bumped on dequeue */
                mutex_enter(QLOCK(q));
                rdc_dump_iohdrs(q);
                SET_QNXTIO(q, QHEAD(q));
                SET_QCOALBOUNDS(q, QHEAD(q));
                group->seq = RDC_NEWSEQ;
                group->seqack = RDC_NEWSEQ;
                mutex_exit(QLOCK(q));
            }
            break;
        }

        if ((aio->iostatus != RDC_IO_DONE) && (group->count)) {
            rdc_k_info_t *krdctmp = &rdc_k_info[aio->index];
            if (krdctmp->type_flag & RDC_DISABLEPEND) {
                kmem_free(aio, sizeof (*aio));
                aio = NULL;
                goto thread_death;
            }
            rdc_group_enter(krdc);
            rdc_group_log(krdc,
                RDC_NOFLUSH | RDC_ALLREMOTE | RDC_QUEUING,
                "diskq flush aio status not RDC_IO_DONE");
            rdc_group_exit(krdc);
            rdc_dump_queue(aio->index);
        }

        kmem_free(aio, sizeof (*aio));
        aio = NULL;

#ifdef DEBUG_DISABLE
        if (krdc->type_flag & RDC_DISABLEPEND) {
            cmn_err(CE_WARN,
                "!rdc_flush_diskq: DISABLE PENDING after IO!");
        }
#endif
        if (krdc->remote_index < 0 || !krdc->lsrv || !krdc->intf)
            break;

        if (IS_QSTATE(q, RDC_QDISABLEPEND)) {
#ifdef DEBUG
            cmn_err(CE_NOTE, "!flusher thread death 2");
#endif
            break;
        }
    }
thread_death:
    rdc_many_enter(krdc);
    mutex_enter(QLOCK(q));
    group->rdc_thrnum--;
    group->rdc_writer = 0;

    if (aio && aio->qhandle) {
        aio->qhandle->sb_user--;
        if (aio->qhandle->sb_user == 0) {
            (void) _rdc_rsrv_diskq(krdc->group);
            rdc_fixlen(aio);
            (void) nsc_free_buf(aio->qhandle);
            aio->qhandle = NULL;
            aio->handle = NULL;
            _rdc_rlse_diskq(krdc->group);
        }
    }
    if ((group->count == 0) && (group->rdc_thrnum == 0)) {
        mutex_exit(QLOCK(q));
        /*
         * Group now empty, so destroy
         * Race with remove_from_group while write thread was running
         */
#ifdef DEBUG
        cmn_err(CE_WARN, "!rdc_flush_diskq: group being destroyed");
#endif
        mutex_enter(&group->diskqmutex);
        rdc_close_diskq(group);
        mutex_exit(&group->diskqmutex);
        rdc_delgroup(group);
        krdc->group = NULL;
        rdc_many_exit(krdc);
        return;
    }
    mutex_exit(QLOCK(q));
    rdc_many_exit(krdc);
}

/*
 * _rdc_remote_flush
 * Flush a single block ANON block
 * this function will flush from either the disk queue
 * or the memory queue. The appropriate locks must be
 * taken out etc, etc ...
 */
static void
_rdc_remote_flush(rdc_aio_t *aio)
{
    rdc_k_info_t *krdc = &rdc_k_info[aio->index];
    rdc_u_info_t *urdc = &rdc_u_info[aio->index];
    disk_queue *q = &krdc->group->diskq;
    kmutex_t *qlock;
    rdc_group_t *group;
    nsc_buf_t *h = NULL;
    int reserved = 0;
    int rtype = RDC_RAW;
    int rc;
    uint_t maxseq;
    struct netwriteres netret;
    int waitq = 1;
    int vflags;

    group = krdc->group;
    netret.vecdata.vecdata_val = NULL;
    netret.vecdata.vecdata_len = 0;

    /* Where did we get this aio from anyway? */
    if (RDC_IS_DISKQ(group)) {
        qlock = &group->diskq.disk_qlock;
    } else {
        qlock = &group->ra_queue.net_qlock;
    }

    /*
     * quench transmission if we are too far ahead of the
     * server Q, or it will overflow.
     * Must fail all requests while asyncdis is set.
     * It will be cleared when the last thread to be discarded
     * sets the asyncstall counter to zero.
     * Note the thread within rdc_net_write
     * also bumps the asyncstall counter.
     */

    mutex_enter(qlock);
    if (group->asyncdis) {
        aio->iostatus = RDC_IO_CANCELLED;
        mutex_exit(qlock);
        goto failed;
    }
    /* don't go to sleep if we have gone logging! */
    vflags = rdc_get_vflags(urdc);
    if ((vflags & (RDC_BMP_FAILED|RDC_VOL_FAILED|RDC_LOGGING))) {
        if ((vflags & RDC_LOGGING) && RDC_IS_DISKQ(group))
            aio->iostatus = RDC_IO_CANCELLED;

        mutex_exit(qlock);
        goto failed;
    }

    while (maxseq = group->seqack + RDC_MAXPENDQ + 1,
        maxseq = (maxseq < group->seqack) ? maxseq + RDC_NEWSEQ + 1
        : maxseq, !RDC_INFRONT(aio->seq, maxseq)) {
        group->asyncstall++;
        ASSERT(!IS_STATE(urdc, RDC_LOGGING));
        cv_wait(&group->asyncqcv, qlock);
        group->asyncstall--;
        ASSERT(group->asyncstall >= 0);
        if (group->asyncdis) {
            if (group->asyncstall == 0) {
                group->asyncdis = 0;
            }
            aio->iostatus = RDC_IO_CANCELLED;
            mutex_exit(qlock);
            goto failed;
        }
        /*
         * See if we have gone into logging mode
         * since sleeping.
         */
        vflags = rdc_get_vflags(urdc);
        if (vflags & (RDC_BMP_FAILED|RDC_VOL_FAILED|RDC_LOGGING)) {
            if ((vflags & RDC_LOGGING) && RDC_IS_DISKQ(group))
                aio->iostatus = RDC_IO_CANCELLED;

            mutex_exit(qlock);
            goto failed;
        }
    }
    mutex_exit(qlock);

    if ((krdc->io_kstats) && (!RDC_IS_DISKQ(krdc->group))) {
        mutex_enter(krdc->io_kstats->ks_lock);
        kstat_waitq_exit(KSTAT_IO_PTR(krdc->io_kstats));
        mutex_exit(krdc->io_kstats->ks_lock);
        waitq = 0;
    }


    rc = _rdc_rsrv_devs(krdc, rtype, RDC_INTERNAL);
    if (rc != 0) {
#ifdef DEBUG
        cmn_err(CE_WARN, "!_rdc_remote_flush: reserve, index %d, rc %d",
            aio->index, rc);
#endif
        goto failed;
    }

    reserved = 1;
    /*
     * Case where we are multihop and calling with no ANON bufs
     * Need to do the read to fill the buf.
     */
    if (!aio->handle) {
        rc = nsc_alloc_buf(RDC_U_FD(krdc), aio->pos, aio->len,
            (aio->flag & ~NSC_WRITE) | NSC_READ, &h);
        if (!RDC_SUCCESS(rc)) {
#ifdef DEBUG
            cmn_err(CE_WARN,
                "!_rdc_remote_flush: alloc_buf, index %d, pos %"
                NSC_SZFMT ", len %" NSC_SZFMT ", rc %d",
                aio->index, aio->pos, aio->len, rc);
#endif

            goto failed;
        }
        aio->handle = h;
        aio->handle->sb_user = RDC_NULLBUFREAD;
    }

    mutex_enter(qlock);
    if (group->asyncdis) {
        if (group->asyncstall == 0) {
            group->asyncdis = 0;
        }
        aio->iostatus = RDC_IO_CANCELLED;
        mutex_exit(qlock);
        goto failed;
    }
    group->asyncstall++;
    mutex_exit(qlock);


    if (krdc->remote_index < 0) {
        /*
         * this should be ok, we are flushing, not rev syncing.
         * remote_index could be -1 if we lost a race with
         * resume and the flusher trys to flush an io from
         * another set that has not resumed
         */
        krdc->remote_index = rdc_net_state(krdc->index, CCIO_SLAVE);

    }

    /*
     * double check for logging, no check in net_write()
     * skip the write if you can, otherwise, if logging
     * avoid clearing the bit .. you don't know whose bit it may
     * also be.
     */
    if (IS_STATE(urdc, RDC_LOGGING) || IS_STATE(urdc, RDC_SYNCING)) {
        aio->iostatus = RDC_IO_CANCELLED;
        mutex_enter(qlock);
        group->asyncstall--;
        mutex_exit(qlock);
        goto failed;
    }

    rc = rdc_net_write(krdc->index, krdc->remote_index,
        aio->handle, aio->pos, aio->len, aio->seq, aio->qpos, &netret);

    mutex_enter(qlock);
    group->asyncstall--;
    if (group->asyncdis) {
        if (group->asyncstall == 0) {
            group->asyncdis = 0;
        }
        aio->iostatus = RDC_IO_CANCELLED;
        mutex_exit(qlock);
        goto failed;
    }

    if (IS_STATE(urdc, RDC_LOGGING) || IS_STATE(urdc, RDC_SYNCING)) {
        mutex_exit(qlock);
        aio->iostatus = RDC_IO_CANCELLED;
        goto failed;
    }

    ASSERT(aio->handle);
    if (rc != 0) {
#ifdef DEBUG
        cmn_err(CE_WARN,
            "!_rdc_remote_flush: write, index %d, pos %" NSC_SZFMT
            ", len %" NSC_SZFMT ", "
            "rc %d seq %u group seq %u seqack %u qpos %" NSC_SZFMT,
            aio->index, aio->pos, aio->len, rc, aio->seq,
            group->seq, group->seqack, aio->qpos);
#endif
        if (rc == ENOLINK) {
            cmn_err(CE_WARN,
                "!Hard timeout detected (%d sec) "
                "on SNDR set %s:%s",
                rdc_rpc_tmout, urdc->secondary.intf,
                urdc->secondary.file);
        }
        mutex_exit(qlock);
        goto failed;
    } else {
        aio->iostatus = RDC_IO_DONE;
    }

    if (RDC_IS_DISKQ(group)) {
        /* free locally alloc'd handle */
        if (aio->handle->sb_user == RDC_NULLBUFREAD) {
            (void) nsc_free_buf(aio->handle);
            aio->handle = NULL;
        }
        aio->qhandle->sb_user--;
        if (aio->qhandle->sb_user == 0) {
            (void) _rdc_rsrv_diskq(group);
            rdc_fixlen(aio);
            (void) nsc_free_buf(aio->qhandle);
            aio->qhandle = NULL;
            aio->handle = NULL;
            _rdc_rlse_diskq(group);
        }

    } else {
        (void) nsc_free_buf(aio->handle);
        aio->handle = NULL;
    }

    mutex_exit(qlock);

    _rdc_rlse_devs(krdc, rtype);

    if (netret.result == 0) {
        vflags = rdc_get_vflags(urdc);

        if (!(vflags & (RDC_BMP_FAILED|RDC_VOL_FAILED|RDC_LOGGING))) {
            RDC_CLR_BITMAP(krdc, aio->pos, aio->len, \
                0xffffffff, RDC_BIT_BUMP);

            if (RDC_IS_DISKQ(krdc->group)) {
                if (!IS_STATE(urdc, RDC_LOGGING)) {
                    /* tell queue data has been flushed */
                    rdc_clr_iohdr(krdc, aio->qpos);
                } else { /* throw away queue, logging */
                    mutex_enter(qlock);
                    rdc_dump_iohdrs(q);
                    SET_QNXTIO(q, QHEAD(q));
                    SET_QCOALBOUNDS(q, QHEAD(q));
                    mutex_exit(qlock);
                }
            }
        }

        mutex_enter(qlock);
        /*
         * Check to see if the reply has arrived out of
         * order, if so don't update seqack.
         */
        if (!RDC_INFRONT(aio->seq, group->seqack)) {
            group->seqack = aio->seq;
        }
#ifdef DEBUG
        else {
            rdc_ooreply++;
        }
#endif
        if (group->asyncstall) {
            cv_broadcast(&group->asyncqcv);
        }
        mutex_exit(qlock);
    } else if (netret.result < 0) {
        aio->iostatus = RDC_IO_FAILED;
    }

    /*
     * see if we have any pending async requests we can mark
     * as done.
     */

    if (netret.vecdata.vecdata_len) {
        net_pendvec_t *vecp;
        net_pendvec_t *vecpe;
        vecp = netret.vecdata.vecdata_val;
        vecpe = netret.vecdata.vecdata_val + netret.vecdata.vecdata_len;
        while (vecp < vecpe) {
            rdc_k_info_t *krdcp = &rdc_k_info[vecp->pindex];
            rdc_u_info_t *urdcp = &rdc_u_info[vecp->pindex];
            /*
             * we must always still be in the same group.
             */
            ASSERT(krdcp->group == group);
            vflags = rdc_get_vflags(urdcp);

            if (!(vflags &
                (RDC_BMP_FAILED|RDC_VOL_FAILED|RDC_LOGGING))) {
                RDC_CLR_BITMAP(krdcp, vecp->apos, vecp->alen, \
                    0xffffffff, RDC_BIT_BUMP);
                if (RDC_IS_DISKQ(krdcp->group)) {
                    if (!IS_STATE(urdc, RDC_LOGGING)) {
                        /* update queue info */
                        rdc_clr_iohdr(krdc, vecp->qpos);
                    } else { /* we've gone logging */
                        mutex_enter(qlock);
                        rdc_dump_iohdrs(q);
                        SET_QNXTIO(q, QHEAD(q));
                        SET_QCOALBOUNDS(q, QHEAD(q));
                        mutex_exit(qlock);
                    }
                }
            }

            /*
             * see if we can re-start transmission
             */
            mutex_enter(qlock);
            if (!RDC_INFRONT(vecp->seq, group->seqack)) {
                group->seqack = vecp->seq;
            }
#ifdef DEBUG
            else {
                rdc_ooreply++;
            }
#endif

            if (group->asyncstall) {
                cv_broadcast(&group->asyncqcv);
            }
            mutex_exit(qlock);
            vecp++;
        }
    }
    if (netret.vecdata.vecdata_val)
        kmem_free(netret.vecdata.vecdata_val,
            netret.vecdata.vecdata_len * sizeof (net_pendvec_t));
    return;
failed:

    /* perhaps we have a few threads stuck .. */
    if (group->asyncstall) {
        group->asyncdis = 1;
        cv_broadcast(&group->asyncqcv);
    }
    if (netret.vecdata.vecdata_val)
        kmem_free(netret.vecdata.vecdata_val,
            netret.vecdata.vecdata_len * sizeof (net_pendvec_t));

    mutex_enter(qlock);
    if (RDC_IS_DISKQ(group)) {
        /* free locally alloc'd hanlde */
        if ((aio->handle) &&
            (aio->handle->sb_user == RDC_NULLBUFREAD)) {
            (void) nsc_free_buf(aio->handle);
            aio->handle = NULL;
        }
        aio->qhandle->sb_user--;
        if (aio->qhandle->sb_user == 0) {
            (void) _rdc_rsrv_diskq(group);
            rdc_fixlen(aio);
            (void) nsc_free_buf(aio->qhandle);
            aio->qhandle = NULL;
            aio->handle = NULL;
            _rdc_rlse_diskq(group);
        }
    } else {
        if (aio->handle) {
            (void) nsc_free_buf(aio->handle);
            aio->handle = NULL;
        }
    }
    mutex_exit(qlock);

    if (reserved) {
        _rdc_rlse_devs(krdc, rtype);
    }

    if ((waitq && krdc->io_kstats) && (!RDC_IS_DISKQ(krdc->group))) {
        mutex_enter(krdc->io_kstats->ks_lock);
        kstat_waitq_exit(KSTAT_IO_PTR(krdc->io_kstats));
        mutex_exit(krdc->io_kstats->ks_lock);
    }

    /* make sure that the bit is still set */
    RDC_CHECK_BIT(krdc, aio->pos, aio->len);

    if (aio->iostatus != RDC_IO_CANCELLED)
        aio->iostatus = RDC_IO_FAILED;
}


/*
 * rdc_drain_disk_queue
 * drain the async network queue for the whole group. Bail out if nothing
 * happens in 20 sec
 * returns -1 if it bails before the queues are drained.
 */
#define NUM_RETRIES 15  /* Number of retries to wait if no progress */
int
rdc_drain_disk_queue(int index)
{
    rdc_k_info_t *krdc = &rdc_k_info[index];
    volatile rdc_group_t *group;
    volatile disk_queue *diskq;
    int threads, counter;
    long blocks;

    /* Sanity checking */
    if (index > rdc_max_sets)
        return (0);

    /*
     * If there is no group or diskq configured, we can leave now
     */
    if (!(group = krdc->group) || !(diskq = &group->diskq))
        return (0);

    /*
     * No need to wait if EMPTY and threads are gone
     */
    counter = 0;
    while (!QEMPTY(diskq) || group->rdc_thrnum) {

        /*
         * Capture counters to determine if progress is being made
         */
        blocks = QBLOCKS(diskq);
        threads = group->rdc_thrnum;

        /*
         * Wait
         */
        delay(HZ);

        /*
         * Has the group or disk queue gone away while delayed?
         */
        if (!(group = krdc->group) || !(diskq = &group->diskq))
            return (0);

        /*
         * Are we still seeing progress?
         */
        if (blocks == QBLOCKS(diskq) && threads == group->rdc_thrnum) {
            /*
             * No progress seen, increment retry counter
             */
            if (counter++ > NUM_RETRIES) {
                return (-1);
            }
        } else {
            /*
             * Reset counter, as we've made progress
             */
            counter = 0;
        }
    }

    return (0);
}

/*
 * decide what needs to be drained, disk or core
 * and drain it
 */
int
rdc_drain_queue(int index)
{
    rdc_k_info_t *krdc = &rdc_k_info[index];
    rdc_group_t *group = krdc->group;

    if (!group)
        return (0);

    if (RDC_IS_DISKQ(group))
        return (rdc_drain_disk_queue(index));
    if (RDC_IS_MEMQ(group))
        return (rdc_drain_net_queue(index));
    /* oops.. */
#ifdef DEBUG
    cmn_err(CE_WARN, "!rdc_drain_queue: "
        "attempting drain of unknown Q type");
#endif
    return (0);
}

/*
 * rdc_drain_net_queue
 * drain the async network queue for the whole group. Bail out if nothing
 * happens in 20 sec
 * returns -1 if it bails before the queues are drained.
 */
int
rdc_drain_net_queue(int index)
{
    rdc_k_info_t *krdc = &rdc_k_info[index];
    volatile net_queue *q;
    int bail = 20;  /* bail out in about 20 secs */
    nsc_size_t blocks;

    /* Sanity checking */
    if (index > rdc_max_sets)
        return (0);
    if (!krdc->group)
        return (0);
    /* LINTED */
    if (!(q = &krdc->group->ra_queue))
        return (0);

    /* CONSTCOND */
    while (1) {

        if (((volatile rdc_aio_t *)q->net_qhead == NULL) &&
            (krdc->group->rdc_thrnum == 0)) {
            break;
        }

        blocks = q->blocks;

        q = (volatile net_queue *)&krdc->group->ra_queue;

        if ((blocks == q->blocks) &&
            (--bail <= 0)) {
            break;
        }

        delay(HZ);
    }

    if (bail <= 0)
        return (-1);

    return (0);
}

/*
 * rdc_dump_queue
 * We want to release all the blocks currently on the network flushing queue
 * We already have them logged in the bitmap.
 */
void
rdc_dump_queue(int index)
{
    rdc_k_info_t *krdc = &rdc_k_info[index];
    rdc_aio_t *aio;
    net_queue *q;
    rdc_group_t *group;
    disk_queue *dq;
    kmutex_t *qlock;

    group = krdc->group;

    q = &group->ra_queue;
    dq = &group->diskq;

    /*
     * gotta have both locks here for diskq
     */

    if (RDC_IS_DISKQ(group)) {
        mutex_enter(&q->net_qlock);
        if (q->qfill_sleeping == RDC_QFILL_AWAKE) {
            int tries = 3;
#ifdef DEBUG_DISKQ
            cmn_err(CE_NOTE,
                "!dumpq sending diskq->memq flusher to sleep");
#endif
            q->qfflags |= RDC_QFILLSLEEP;
            mutex_exit(&q->net_qlock);
            while (q->qfill_sleeping == RDC_QFILL_AWAKE && tries--)
                delay(5);
            mutex_enter(&q->net_qlock);
        }
    }

    if (RDC_IS_DISKQ(group)) {
        qlock = &dq->disk_qlock;
        (void) _rdc_rsrv_diskq(group);
    } else {
        qlock = &q->net_qlock;
    }

    mutex_enter(qlock);

    group->seq = RDC_NEWSEQ;    /* reset the sequence number */
    group->seqack = RDC_NEWSEQ;

    /* if the q is on disk, dump the q->iohdr chain */
    if (RDC_IS_DISKQ(group)) {
        rdc_dump_iohdrs(dq);

        /* back up the nxtio pointer */
        SET_QNXTIO(dq, QHEAD(dq));
        SET_QCOALBOUNDS(dq, QHEAD(dq));
    }

    while (q->net_qhead) {
        rdc_k_info_t *tmpkrdc;
        aio = q->net_qhead;
        tmpkrdc = &rdc_k_info[aio->index];

        if (RDC_IS_DISKQ(group)) {
            aio->qhandle->sb_user--;
            if (aio->qhandle->sb_user == 0) {
                rdc_fixlen(aio);
                (void) nsc_free_buf(aio->qhandle);
                aio->qhandle = NULL;
                aio->handle = NULL;
            }
        } else {
            if (aio->handle) {
                (void) nsc_free_buf(aio->handle);
                aio->handle = NULL;
            }
        }

        q->net_qhead = aio->next;
        RDC_CHECK_BIT(tmpkrdc, aio->pos, aio->len);

        kmem_free(aio, sizeof (*aio));
        if (tmpkrdc->io_kstats && !RDC_IS_DISKQ(group)) {
            mutex_enter(tmpkrdc->io_kstats->ks_lock);
            kstat_waitq_exit(KSTAT_IO_PTR(tmpkrdc->io_kstats));
            mutex_exit(tmpkrdc->io_kstats->ks_lock);
        }

    }

    q->net_qtail = NULL;
    q->blocks = 0;
    q->nitems = 0;

    /*
     * See if we have stalled threads.
     */
done:
    if (group->asyncstall) {
        group->asyncdis = 1;
        cv_broadcast(&group->asyncqcv);
    }
    mutex_exit(qlock);
    if (RDC_IS_DISKQ(group)) {
        mutex_exit(&q->net_qlock);
        _rdc_rlse_diskq(group);
    }

}


/*
 * rdc_clnt_get
 * Get a CLIENT handle and cache it
 */

static int
rdc_clnt_get(rdc_srv_t *svp, rpcvers_t vers, struct chtab **rch, CLIENT **clp)
{
    uint_t  max_msgsize;
    int retries;
    int ret;
    struct cred     *cred;
    int num_clnts = 0;
    register struct chtab *ch;
    struct chtab **plistp;
    CLIENT *client = 0;

    if (rch) {
        *rch = 0;
    }

    if (clp) {
        *clp = 0;
    }

    retries = 6;    /* Never used for COTS in Solaris */
    cred = ddi_get_cred();
    max_msgsize = RDC_RPC_MAX;

    mutex_enter(&rdc_clnt_lock);

    ch = rdc_chtable;
    plistp = &rdc_chtable;

    /* find the right ch_list chain */

    for (ch = rdc_chtable; ch != NULL; ch = ch->ch_next) {
        if (ch->ch_prog == RDC_PROGRAM &&
            ch->ch_vers == vers &&
            ch->ch_dev == svp->ri_knconf->knc_rdev &&
            ch->ch_protofmly != NULL &&
            strcmp(ch->ch_protofmly,
            svp->ri_knconf->knc_protofmly) == 0) {
            /* found the correct chain to walk */
            break;
        }
        plistp = &ch->ch_next;
    }

    if (ch != NULL) {
        /* walk the ch_list and try and find a free client */

        for (num_clnts = 0; ch != NULL; ch = ch->ch_list, num_clnts++) {
            if (ch->ch_inuse == FALSE) {
                /* suitable handle to reuse */
                break;
            }
            plistp = &ch->ch_list;
        }
    }

    if (ch == NULL && num_clnts >= MAXCLIENTS) {
        /* alloc a temporary handle and return */

        rdc_clnt_toomany++;
        mutex_exit(&rdc_clnt_lock);

        ret = clnt_tli_kcreate(svp->ri_knconf, &(svp->ri_addr),
            RDC_PROGRAM, vers, max_msgsize, retries, cred, &client);

        if (ret != 0) {
            cmn_err(CE_NOTE,
                "!rdc_call: tli_kcreate failed %d", ret);
            return (ret);
        }

        *rch = 0;
        *clp = client;
        (void) CLNT_CONTROL(client, CLSET_PROGRESS, NULL);
        return (ret);
    }

    if (ch != NULL) {
        /* reuse a cached handle */

        ch->ch_inuse = TRUE;
        ch->ch_timesused++;
        mutex_exit(&rdc_clnt_lock);

        *rch = ch;

        if (ch->ch_client == NULL) {
            ret = clnt_tli_kcreate(svp->ri_knconf, &(svp->ri_addr),
                RDC_PROGRAM, vers, max_msgsize, retries,
                cred, &ch->ch_client);
            if (ret != 0) {
                ch->ch_inuse = FALSE;
                return (ret);
            }

            (void) CLNT_CONTROL(ch->ch_client, CLSET_PROGRESS,
                NULL);
            *clp = ch->ch_client;

            return (0);
        } else {
        /*
         * Consecutive calls to CLNT_CALL() on the same client handle
         * get the same transaction ID.  We want a new xid per call,
         * so we first reinitialise the handle.
         */
            (void) clnt_tli_kinit(ch->ch_client, svp->ri_knconf,
                &(svp->ri_addr), max_msgsize, retries, cred);

            *clp = ch->ch_client;
            return (0);
        }
    }

    /* create new handle and cache it */
    ch = (struct chtab *)kmem_zalloc(sizeof (*ch), KM_SLEEP);

    if (ch) {
        ch->ch_inuse = TRUE;
        ch->ch_prog = RDC_PROGRAM;
        ch->ch_vers = vers;
        ch->ch_dev = svp->ri_knconf->knc_rdev;
        ch->ch_protofmly = (char *)kmem_zalloc(
            strlen(svp->ri_knconf->knc_protofmly)+1, KM_SLEEP);
        if (ch->ch_protofmly)
            (void) strcpy(ch->ch_protofmly,
                svp->ri_knconf->knc_protofmly);
        *plistp = ch;
    }

    mutex_exit(&rdc_clnt_lock);

    ret = clnt_tli_kcreate(svp->ri_knconf, &(svp->ri_addr),
        RDC_PROGRAM, vers, max_msgsize, retries, cred, clp);

    if (ret != 0) {
        if (ch)
            ch->ch_inuse = FALSE;
        cmn_err(CE_NOTE, "!rdc_call: tli_kcreate failed %d", ret);
        return (ret);
    }

    *rch = ch;
    if (ch)
        ch->ch_client = *clp;

    (void) CLNT_CONTROL(*clp, CLSET_PROGRESS, NULL);

    return (ret);
}


long rdc_clnt_count = 0;

/*
 * rdc_clnt_call
 * Arguments:
 *  rdc_srv_t *svp - rdc servinfo
 *  rpcproc_t proc; - rpcid
 *  rpcvers_t vers; - protocol version
 *  xdrproc_t xargs;- xdr function
 *  caddr_t argsp;- args to xdr function
 *  xdrproc_t xres;- xdr function
 *  caddr_t resp;- args to xdr function
 *  struct timeval timeout;
 * Performs RPC client call using specific protocol and version
 */

int
rdc_clnt_call(rdc_srv_t *svp, rpcproc_t proc, rpcvers_t vers,
        xdrproc_t xargs, caddr_t argsp,
        xdrproc_t xres, caddr_t resp, struct timeval *timeout)
{
    CLIENT *rh = NULL;
    int err;
    int tries = 0;
    struct chtab *ch = NULL;

    err = rdc_clnt_get(svp, vers, &ch, &rh);
    if (err || !rh)
        return (err);

    do {
        DTRACE_PROBE3(rdc_clnt_call_1,
            CLIENT *, rh, rpcproc_t, proc, xdrproc_t, xargs);

        err = cl_call_sig(rh, proc, xargs, argsp, xres, resp, *timeout);

        DTRACE_PROBE1(rdc_clnt_call_end, int, err);

        switch (err) {
            case RPC_SUCCESS: /* bail now */
                goto done;
            case RPC_INTR:  /* No recovery from this */
                goto done;
            case RPC_PROGVERSMISMATCH:
                goto done;
            case RPC_TLIERROR:
                /* fall thru */
            case RPC_XPRTFAILED:
                /* Delay here to err on side of caution */
                /* fall thru */
            case RPC_VERSMISMATCH:

            default:
                if (IS_UNRECOVERABLE_RPC(err)) {
                    goto done;
                }
                tries++;
            /*
             * The call is in progress (over COTS)
             * Try the CLNT_CALL again, but don't
             * print a noisy error message
             */
                if (err == RPC_INPROGRESS)
                    break;
                cmn_err(CE_NOTE, "!SNDR client: err %d %s",
                    err, clnt_sperrno(err));
            }
    } while (tries && (tries < 2));
done:
    ++rdc_clnt_count;
    rdc_clnt_free(ch, rh);
    return (err);
}


/*
 * Call an rpc from the client side, not caring which protocol is used.
 */
int
rdc_clnt_call_any(rdc_srv_t *svp, rdc_if_t *ip, rpcproc_t proc,
        xdrproc_t xargs, caddr_t argsp,
        xdrproc_t xres, caddr_t resp, struct timeval *timeout)
{
    rpcvers_t vers;
    int rc;

    if (ip != NULL) {
        vers = ip->rpc_version;
    } else {
        vers = RDC_VERS_MAX;
    }

    do {
        rc = rdc_clnt_call(svp, proc, vers, xargs, argsp,
            xres, resp, timeout);

        if (rc == RPC_PROGVERSMISMATCH) {
            /*
             * Downgrade and try again.
             */
            vers--;
        }
    } while ((vers >= RDC_VERS_MIN) && (rc == RPC_PROGVERSMISMATCH));

    if ((rc == 0) && (ip != NULL) && (vers != ip->rpc_version)) {
        mutex_enter(&rdc_ping_lock);
        ip->rpc_version = vers;
        mutex_exit(&rdc_ping_lock);
    }

    return (rc);
}

/*
 * Call an rpc from the client side, starting with protocol specified
 */
int
rdc_clnt_call_walk(rdc_k_info_t *krdc, rpcproc_t proc, xdrproc_t xargs,
        caddr_t argsp, xdrproc_t xres, caddr_t resp,
        struct timeval *timeout)
{
    int rc;
    rpcvers_t vers;
    rdc_srv_t *svp = krdc->lsrv;
    rdc_if_t *ip = krdc->intf;
    vers = krdc->rpc_version;

    do {
        rc = rdc_clnt_call(svp, proc, vers, xargs, argsp,
            xres, resp, timeout);

        if (rc == RPC_PROGVERSMISMATCH) {
            /*
             * Downgrade and try again.
             */
            vers--;
        }
    } while ((vers >= RDC_VERS_MIN) && (rc == RPC_PROGVERSMISMATCH));

    if ((rc == 0) && (ip != NULL) && (vers != ip->rpc_version)) {
        mutex_enter(&rdc_ping_lock);
        ip->rpc_version = vers;
        mutex_exit(&rdc_ping_lock);
    }

    return (rc);
}

/*
 * rdc_clnt_free
 * Free a client structure into the cache, or if this was a temporary
 * handle allocated above MAXCLIENTS, destroy it.
 */
static void
rdc_clnt_free(struct chtab *ch, CLIENT *clp)
{
    if (ch != NULL) {
        /* cached client, just clear inuse flag and return */
        ASSERT(ch->ch_client == clp);
        ch->ch_inuse = FALSE;
        return;
    }

    /* temporary handle allocated above MAXCLIENTS, so destroy it */

    if (clp->cl_auth) {
        AUTH_DESTROY(clp->cl_auth);
        clp->cl_auth = 0;
    }

    CLNT_DESTROY(clp);
}


/*
 * _rdc_clnt_destroy
 * Free a chain (ch_list or ch_next) of cached clients
 */
static int
_rdc_clnt_destroy(struct chtab **p, const int list)
{
    struct chtab *ch;
    int leak = 0;

    if (!p)
        return (0);

    while (*p != NULL) {
        ch = *p;

        /*
         * unlink from the chain
         * - this leaks the client if it was inuse
         */

        *p = list ? ch->ch_list : ch->ch_next;

        if (!ch->ch_inuse) {
            /* unused client - destroy it */

            if (ch->ch_client) {
                if (ch->ch_client->cl_auth) {
                    AUTH_DESTROY(ch->ch_client->cl_auth);
                    ch->ch_client->cl_auth = 0;
                }

                CLNT_DESTROY(ch->ch_client);
                ch->ch_client = 0;
            }

            if (ch->ch_protofmly)
                kmem_free(ch->ch_protofmly,
                    strlen(ch->ch_protofmly)+1);

            kmem_free(ch, sizeof (*ch));
        } else {
            /* remember client leak */
            leak++;
        }
    }

    return (leak);
}


/*
 * rdc_clnt_destroy
 * Free client caching table on unconfigure
 */
void
rdc_clnt_destroy(void)
{
    struct chtab *ch;
    int leak = 0;

    mutex_enter(&rdc_clnt_lock);

    /* destroy each ch_list chain */

    for (ch = rdc_chtable; ch; ch = ch->ch_next) {
        leak += _rdc_clnt_destroy(&ch->ch_list, 1);
    }

    /* destroy the main ch_next chain */
    leak += _rdc_clnt_destroy(&rdc_chtable, 0);

    if (leak) {
        /* we are about to leak clients */
        cmn_err(CE_WARN,
            "!rdc_clnt_destroy: leaking %d inuse clients", leak);
    }

    mutex_exit(&rdc_clnt_lock);
}

#ifdef  DEBUG
/*
 * Function to send an asynchronous net_data6 request
 * direct to a server to allow the generation of
 * out of order requests for ZatoIchi tests.
 */
int
rdc_async6(void *arg, int mode, int *rvp)
{
    int         index;
    rdc_async6_t        async6;
    struct net_data6    data6;
    rdc_k_info_t        *krdc;
    rdc_u_info_t        *urdc;
    char            *data;
    int         datasz;
    char            *datap;
    int         rc;
    struct timeval      t;
    struct netwriteres  netret;
    int i;

    rc = 0;
    *rvp = 0;
    /*
     * copyin the user's arguments.
     */
    if (ddi_copyin(arg, &async6, sizeof (async6), mode) < 0) {
        return (EFAULT);
    }

    /*
     * search by the secondary host and file.
     */
    mutex_enter(&rdc_conf_lock);
    for (index = 0; index < rdc_max_sets; index++) {
        urdc = &rdc_u_info[index];
        krdc = &rdc_k_info[index];

        if (!IS_CONFIGURED(krdc))
            continue;
        if (!IS_ENABLED(urdc))
            continue;
        if (!IS_ASYNC(urdc))
            continue;
        if (krdc->rpc_version < RDC_VERSION6)
            continue;

        if ((strncmp(urdc->secondary.intf, async6.sechost,
            MAX_RDC_HOST_SIZE) == 0) &&
            (strncmp(urdc->secondary.file, async6.secfile,
            NSC_MAXPATH) == 0)) {
            break;
        }
    }
    mutex_exit(&rdc_conf_lock);
    if (index >= rdc_max_sets) {
        return (ENOENT);
    }

    if (async6.spos != -1) {
        if ((async6.spos < async6.pos) ||
            ((async6.spos + async6.slen) >
            (async6.pos + async6.len))) {
            cmn_err(CE_WARN, "!Sub task not within range "
                "start %d length %d sub start %d sub length %d",
                async6.pos, async6.len, async6.spos, async6.slen);
            return (EIO);
        }
    }

    datasz = FBA_SIZE(1);
    data = kmem_alloc(datasz, KM_SLEEP);
    datap = data;
    while (datap < &data[datasz]) {
        /* LINTED */
        *datap++ = async6.pat;
    }

    /*
     * Fill in the net databuffer prior to transmission.
     */

    data6.local_cd = krdc->index;
    if (krdc->remote_index == -1) {
        cmn_err(CE_WARN, "!Remote index not known");
        kmem_free(data, datasz);
        return (EIO);
    } else {
        data6.cd = krdc->remote_index;
    }
    data6.pos = async6.pos;
    data6.len = async6.len;
    data6.flag = 0;
    data6.idx = async6.idx;
    data6.seq = async6.seq;

    if (async6.spos == -1) {
        data6.sfba = async6.pos;
        data6.nfba = async6.len;
        data6.endoblk = 1;

    } else {
        data6.sfba = async6.spos;
        data6.nfba = async6.slen;
        data6.endoblk = async6.endind;
    }

    data6.data.data_len = datasz;
    data6.data.data_val = data;

    t.tv_sec = rdc_rpc_tmout;
    t.tv_usec = 0;

    netret.vecdata.vecdata_val = NULL;
    netret.vecdata.vecdata_len = 0;


    rc = rdc_clnt_call(krdc->lsrv, RDCPROC_WRITE6, krdc->rpc_version,
        xdr_net_data6, (char *)&data6, xdr_netwriteres, (char *)&netret,
        &t);

    kmem_free(data, datasz);
    if (rc == 0) {
        if (netret.result < 0) {
            rc = -netret.result;
        }
        cmn_err(CE_NOTE, "!async6: seq %u result %d index %d "
            "pendcnt %d",
            netret.seq, netret.result, netret.index,
            netret.vecdata.vecdata_len);
        for (i = 0; i < netret.vecdata.vecdata_len; i++) {
            net_pendvec_t pvec;
            bcopy(netret.vecdata.vecdata_val + i, &pvec,
                sizeof (net_pendvec_t));
            cmn_err(CE_NOTE, "!Seq %u pos %llu len %llu",
                pvec.seq, (unsigned long long)pvec.apos,
                (unsigned long long)pvec.alen);
        }
        if (netret.vecdata.vecdata_val)
            kmem_free(netret.vecdata.vecdata_val,
                netret.vecdata.vecdata_len *
                sizeof (net_pendvec_t));
    } else {
        cmn_err(CE_NOTE, "!async6: rpc call failed %d", rc);
    }
    *rvp = netret.index;
    return (rc);
}

/*
 * Function to send an net_read6 request
 * direct to a server to allow the generation of
 * read requests.
 */
int
rdc_readgen(void *arg, int mode, int *rvp)
{
    int         index;
    rdc_readgen_t       readgen;
    rdc_readgen32_t     readgen32;
    struct rread6       read6;
    struct rread        read5;
    rdc_k_info_t        *krdc;
    int         ret;
    struct timeval      t;
    struct rdcrdresult  rr;
    int         err;

    *rvp = 0;
    rr.rr_bufsize = 0;  /* rpc data buffer length (bytes) */
    rr.rr_data = NULL;  /* rpc data buffer */
    if (ddi_model_convert_from(mode & FMODELS) == DDI_MODEL_ILP32) {
        if (ddi_copyin(arg, &readgen32, sizeof (readgen32), mode)) {
            return (EFAULT);
        }
        (void) strncpy(readgen.sechost, readgen32.sechost,
            MAX_RDC_HOST_SIZE);
        (void) strncpy(readgen.secfile, readgen32.secfile, NSC_MAXPATH);
        readgen.len = readgen32.len;
        readgen.pos = readgen32.pos;
        readgen.idx = readgen32.idx;
        readgen.flag = readgen32.flag;
        readgen.data = (void *)(unsigned long)readgen32.data;
        readgen.rpcversion = readgen32.rpcversion;
    } else {
        if (ddi_copyin(arg, &readgen, sizeof (readgen), mode)) {
            return (EFAULT);
        }
    }
    switch (readgen.rpcversion) {
    case 5:
    case 6:
        break;
    default:
        return (EINVAL);
    }

    mutex_enter(&rdc_conf_lock);
    index = rdc_lookup_byhostdev(readgen.sechost, readgen.secfile);
    if (index >= 0) {
        krdc = &rdc_k_info[index];
    }
    if (index < 0 || (krdc->type_flag & RDC_DISABLEPEND)) {
        mutex_exit(&rdc_conf_lock);
        return (ENODEV);
    }
    /*
     * we should really call setbusy here.
     */
    mutex_exit(&rdc_conf_lock);

    t.tv_sec = rdc_rpc_tmout;
    t.tv_usec = 0;
    if (krdc->remote_index == -1) {
        cmn_err(CE_WARN, "!Remote index not known");
        ret = EIO;
        goto out;
    }
    if (readgen.rpcversion == 6) {
        read6.cd = krdc->remote_index;
        read6.len = readgen.len;
        read6.pos = readgen.pos;
        read6.idx = readgen.idx;
        read6.flag = readgen.flag;
    } else {
        read5.cd = krdc->remote_index;
        read5.len = readgen.len;
        read5.pos = readgen.pos;
        read5.idx = readgen.idx;
        read5.flag = readgen.flag;
    }

    if (readgen.flag & RDC_RREAD_START) {
        if (readgen.rpcversion == 6) {
            err = rdc_clnt_call(krdc->lsrv, RDCPROC_READ6,
                RDC_VERSION6, xdr_rread6, (char *)&read6,
                xdr_int, (char *)&ret, &t);
        } else {
            err = rdc_clnt_call(krdc->lsrv, RDCPROC_READ5,
                RDC_VERSION5, xdr_rread, (char *)&read5,
                xdr_int, (char *)&ret, &t);
        }
        if (err == 0) {
            *rvp = ret;
            ret = 0;
        } else {
            ret = EPROTO;
        }
    } else {
        if (readgen.rpcversion == 6) {
            err = rdc_clnt_call(krdc->lsrv, RDCPROC_READ6,
                RDC_VERSION6, xdr_rread6, (char *)&read6,
                xdr_rdresult, (char *)&rr, &t);
        } else {
            err = rdc_clnt_call(krdc->lsrv, RDCPROC_READ5,
                RDC_VERSION5, xdr_rread, (char *)&read5,
                xdr_rdresult, (char *)&rr, &t);
        }
        if (err == 0) {
            if (rr.rr_status != RDC_OK) {
                ret = EIO;
                goto out;
            }
            *rvp = rr.rr_bufsize;
            if (ddi_copyout(rr.rr_data, readgen.data,
                rr.rr_bufsize, mode) != 0) {
                ret = EFAULT;
                goto out;
            }
            ret = 0;
        } else {
            ret = EPROTO;
            goto out;
        }
    }
out:
    if (rr.rr_data) {
        kmem_free(rr.rr_data, rr.rr_bufsize);
    }
    return (ret);
}


#endif