af062818b47340eef15700d2f0211576ba3506eevboxsync/*
af062818b47340eef15700d2f0211576ba3506eevboxsync * WideCharToMultiByte implementation
af062818b47340eef15700d2f0211576ba3506eevboxsync *
af062818b47340eef15700d2f0211576ba3506eevboxsync * Copyright 2000 Alexandre Julliard
af062818b47340eef15700d2f0211576ba3506eevboxsync *
af062818b47340eef15700d2f0211576ba3506eevboxsync * This library is free software; you can redistribute it and/or
af062818b47340eef15700d2f0211576ba3506eevboxsync * modify it under the terms of the GNU Lesser General Public
af062818b47340eef15700d2f0211576ba3506eevboxsync * License as published by the Free Software Foundation; either
af062818b47340eef15700d2f0211576ba3506eevboxsync * version 2.1 of the License, or (at your option) any later version.
af062818b47340eef15700d2f0211576ba3506eevboxsync *
af062818b47340eef15700d2f0211576ba3506eevboxsync * This library is distributed in the hope that it will be useful,
af062818b47340eef15700d2f0211576ba3506eevboxsync * but WITHOUT ANY WARRANTY; without even the implied warranty of
af062818b47340eef15700d2f0211576ba3506eevboxsync * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the GNU
af062818b47340eef15700d2f0211576ba3506eevboxsync * Lesser General Public License for more details.
af062818b47340eef15700d2f0211576ba3506eevboxsync *
af062818b47340eef15700d2f0211576ba3506eevboxsync * You should have received a copy of the GNU Lesser General Public
af062818b47340eef15700d2f0211576ba3506eevboxsync * License along with this library; if not, write to the Free Software
af062818b47340eef15700d2f0211576ba3506eevboxsync * Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301, USA
af062818b47340eef15700d2f0211576ba3506eevboxsync */
af062818b47340eef15700d2f0211576ba3506eevboxsync
b955672b950093ff7416d1269dd4d3b69983bd8fvboxsync/*
4b9d6701570cb98fd36e209314239d104ec584d3vboxsync * Oracle LGPL Disclaimer: For the avoidance of doubt, except that if any license choice
4b9d6701570cb98fd36e209314239d104ec584d3vboxsync * other than GPL or LGPL is available it will apply instead, Oracle elects to use only
b955672b950093ff7416d1269dd4d3b69983bd8fvboxsync * the Lesser General Public License version 2.1 (LGPLv2) at this time for any software where
b955672b950093ff7416d1269dd4d3b69983bd8fvboxsync * a choice of LGPL license versions is made available with the language indicating
b955672b950093ff7416d1269dd4d3b69983bd8fvboxsync * that LGPLv2 or any later version may be used, or where a choice of which version
b955672b950093ff7416d1269dd4d3b69983bd8fvboxsync * of the LGPL is applied is otherwise unspecified.
b955672b950093ff7416d1269dd4d3b69983bd8fvboxsync */
b955672b950093ff7416d1269dd4d3b69983bd8fvboxsync
114410893548b9522c46fdcbd8f63385eb8bfb68vboxsync#include "config.h"
114410893548b9522c46fdcbd8f63385eb8bfb68vboxsync#include "wine/port.h"
114410893548b9522c46fdcbd8f63385eb8bfb68vboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync#include <string.h>
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync#include "wine/unicode.h"
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* search for a character in the unicode_compose_table; helper for compose() */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic inline int binary_search( WCHAR ch, int low, int high )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync extern const WCHAR unicode_compose_table[];
af062818b47340eef15700d2f0211576ba3506eevboxsync while (low <= high)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync int pos = (low + high) / 2;
af062818b47340eef15700d2f0211576ba3506eevboxsync if (unicode_compose_table[2*pos] < ch)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync low = pos + 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync continue;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (unicode_compose_table[2*pos] > ch)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync high = pos - 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync continue;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync return pos;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync return -1;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* return the result of the composition of two Unicode chars, or 0 if none */
af062818b47340eef15700d2f0211576ba3506eevboxsyncWCHAR compose( const WCHAR *str )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync extern const WCHAR unicode_compose_table[];
af062818b47340eef15700d2f0211576ba3506eevboxsync extern const unsigned int unicode_compose_table_size;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync int idx = 1, low = 0, high = unicode_compose_table_size - 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync for (;;)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync int pos = binary_search( str[idx], low, high );
af062818b47340eef15700d2f0211576ba3506eevboxsync if (pos == -1) return 0;
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!idx--) return unicode_compose_table[2*pos+1];
af062818b47340eef15700d2f0211576ba3506eevboxsync low = unicode_compose_table[2*pos+1];
af062818b47340eef15700d2f0211576ba3506eevboxsync high = unicode_compose_table[2*pos+3] - 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/****************************************************************/
af062818b47340eef15700d2f0211576ba3506eevboxsync/* sbcs support */
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* check if 'ch' is an acceptable sbcs mapping for 'wch' */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic inline int is_valid_sbcs_mapping( const struct sbcs_table *table, int flags,
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR wch, unsigned char ch )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
114410893548b9522c46fdcbd8f63385eb8bfb68vboxsync if ((flags & WC_NO_BEST_FIT_CHARS) || ch == (unsigned char)table->info.def_char)
114410893548b9522c46fdcbd8f63385eb8bfb68vboxsync return (table->cp2uni[ch] == wch);
114410893548b9522c46fdcbd8f63385eb8bfb68vboxsync return 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* query necessary dst length for src string */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic int get_length_sbcs( const struct sbcs_table *table, int flags,
af062818b47340eef15700d2f0211576ba3506eevboxsync const WCHAR *src, unsigned int srclen, int *used )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned char * const uni2cp_low = table->uni2cp_low;
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_high = table->uni2cp_high;
af062818b47340eef15700d2f0211576ba3506eevboxsync int ret, tmp;
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR composed;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!used) used = &tmp; /* avoid checking on every char */
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 0;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync for (ret = 0; srclen; ret++, src++, srclen--)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR wch = *src;
af062818b47340eef15700d2f0211576ba3506eevboxsync unsigned char ch;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if ((flags & WC_COMPOSITECHECK) && (srclen > 1) && (composed = compose(src)))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* now check if we can use the composed char */
af062818b47340eef15700d2f0211576ba3506eevboxsync ch = uni2cp_low[uni2cp_high[composed >> 8] + (composed & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync if (is_valid_sbcs_mapping( table, flags, composed, ch ))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* we have a good mapping, use it */
af062818b47340eef15700d2f0211576ba3506eevboxsync src++;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync continue;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync /* no mapping for the composed char, check the other flags */
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags & WC_DEFAULTCHAR) /* use the default char instead */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync src++; /* skip the non-spacing char */
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync continue;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags & WC_DISCARDNS) /* skip the second char of the composition */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync src++;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync /* WC_SEPCHARS is the default */
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!*used)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync ch = uni2cp_low[uni2cp_high[wch >> 8] + (wch & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = !is_valid_sbcs_mapping( table, flags, wch, ch );
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync return ret;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* wcstombs for single-byte code page */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic inline int wcstombs_sbcs( const struct sbcs_table *table,
af062818b47340eef15700d2f0211576ba3506eevboxsync const WCHAR *src, unsigned int srclen,
af062818b47340eef15700d2f0211576ba3506eevboxsync char *dst, unsigned int dstlen )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned char * const uni2cp_low = table->uni2cp_low;
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_high = table->uni2cp_high;
af062818b47340eef15700d2f0211576ba3506eevboxsync int ret = srclen;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (dstlen < srclen)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* buffer too small: fill it up to dstlen and return error */
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen = dstlen;
af062818b47340eef15700d2f0211576ba3506eevboxsync ret = -1;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync while (srclen >= 16)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[0] = uni2cp_low[uni2cp_high[src[0] >> 8] + (src[0] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[1] = uni2cp_low[uni2cp_high[src[1] >> 8] + (src[1] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[2] = uni2cp_low[uni2cp_high[src[2] >> 8] + (src[2] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[3] = uni2cp_low[uni2cp_high[src[3] >> 8] + (src[3] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[4] = uni2cp_low[uni2cp_high[src[4] >> 8] + (src[4] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[5] = uni2cp_low[uni2cp_high[src[5] >> 8] + (src[5] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[6] = uni2cp_low[uni2cp_high[src[6] >> 8] + (src[6] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[7] = uni2cp_low[uni2cp_high[src[7] >> 8] + (src[7] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[8] = uni2cp_low[uni2cp_high[src[8] >> 8] + (src[8] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[9] = uni2cp_low[uni2cp_high[src[9] >> 8] + (src[9] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[10] = uni2cp_low[uni2cp_high[src[10] >> 8] + (src[10] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[11] = uni2cp_low[uni2cp_high[src[11] >> 8] + (src[11] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[12] = uni2cp_low[uni2cp_high[src[12] >> 8] + (src[12] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[13] = uni2cp_low[uni2cp_high[src[13] >> 8] + (src[13] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[14] = uni2cp_low[uni2cp_high[src[14] >> 8] + (src[14] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[15] = uni2cp_low[uni2cp_high[src[15] >> 8] + (src[15] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync src += 16;
af062818b47340eef15700d2f0211576ba3506eevboxsync dst += 16;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen -= 16;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync /* now handle remaining characters */
af062818b47340eef15700d2f0211576ba3506eevboxsync src += srclen;
af062818b47340eef15700d2f0211576ba3506eevboxsync dst += srclen;
af062818b47340eef15700d2f0211576ba3506eevboxsync switch(srclen)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync case 15: dst[-15] = uni2cp_low[uni2cp_high[src[-15] >> 8] + (src[-15] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 14: dst[-14] = uni2cp_low[uni2cp_high[src[-14] >> 8] + (src[-14] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 13: dst[-13] = uni2cp_low[uni2cp_high[src[-13] >> 8] + (src[-13] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 12: dst[-12] = uni2cp_low[uni2cp_high[src[-12] >> 8] + (src[-12] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 11: dst[-11] = uni2cp_low[uni2cp_high[src[-11] >> 8] + (src[-11] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 10: dst[-10] = uni2cp_low[uni2cp_high[src[-10] >> 8] + (src[-10] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 9: dst[-9] = uni2cp_low[uni2cp_high[src[-9] >> 8] + (src[-9] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 8: dst[-8] = uni2cp_low[uni2cp_high[src[-8] >> 8] + (src[-8] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 7: dst[-7] = uni2cp_low[uni2cp_high[src[-7] >> 8] + (src[-7] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 6: dst[-6] = uni2cp_low[uni2cp_high[src[-6] >> 8] + (src[-6] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 5: dst[-5] = uni2cp_low[uni2cp_high[src[-5] >> 8] + (src[-5] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 4: dst[-4] = uni2cp_low[uni2cp_high[src[-4] >> 8] + (src[-4] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 3: dst[-3] = uni2cp_low[uni2cp_high[src[-3] >> 8] + (src[-3] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 2: dst[-2] = uni2cp_low[uni2cp_high[src[-2] >> 8] + (src[-2] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 1: dst[-1] = uni2cp_low[uni2cp_high[src[-1] >> 8] + (src[-1] & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync case 0: break;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync return ret;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* slow version of wcstombs_sbcs that handles the various flags */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic int wcstombs_sbcs_slow( const struct sbcs_table *table, int flags,
af062818b47340eef15700d2f0211576ba3506eevboxsync const WCHAR *src, unsigned int srclen,
af062818b47340eef15700d2f0211576ba3506eevboxsync char *dst, unsigned int dstlen,
af062818b47340eef15700d2f0211576ba3506eevboxsync const char *defchar, int *used )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned char * const uni2cp_low = table->uni2cp_low;
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_high = table->uni2cp_high;
af062818b47340eef15700d2f0211576ba3506eevboxsync unsigned char def;
af062818b47340eef15700d2f0211576ba3506eevboxsync unsigned int len;
af062818b47340eef15700d2f0211576ba3506eevboxsync int tmp;
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR composed;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!defchar)
af062818b47340eef15700d2f0211576ba3506eevboxsync def = table->info.def_char & 0xff;
af062818b47340eef15700d2f0211576ba3506eevboxsync else
af062818b47340eef15700d2f0211576ba3506eevboxsync def = *defchar;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!used) used = &tmp; /* avoid checking on every char */
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 0;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync for (len = dstlen; srclen && len; dst++, len--, src++, srclen--)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR wch = *src;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if ((flags & WC_COMPOSITECHECK) && (srclen > 1) && (composed = compose(src)))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* now check if we can use the composed char */
af062818b47340eef15700d2f0211576ba3506eevboxsync *dst = uni2cp_low[uni2cp_high[composed >> 8] + (composed & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync if (is_valid_sbcs_mapping( table, flags, composed, *dst ))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* we have a good mapping, use it */
af062818b47340eef15700d2f0211576ba3506eevboxsync src++;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync continue;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync /* no mapping for the composed char, check the other flags */
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags & WC_DEFAULTCHAR) /* use the default char instead */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync *dst = def;
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync src++; /* skip the non-spacing char */
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync continue;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags & WC_DISCARDNS) /* skip the second char of the composition */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync src++;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync /* WC_SEPCHARS is the default */
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync *dst = uni2cp_low[uni2cp_high[wch >> 8] + (wch & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!is_valid_sbcs_mapping( table, flags, wch, *dst ))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync *dst = def;
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (srclen) return -1; /* overflow */
af062818b47340eef15700d2f0211576ba3506eevboxsync return dstlen - len;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/****************************************************************/
af062818b47340eef15700d2f0211576ba3506eevboxsync/* dbcs support */
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* check if 'ch' is an acceptable dbcs mapping for 'wch' */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic inline int is_valid_dbcs_mapping( const struct dbcs_table *table, int flags,
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR wch, unsigned short ch )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
114410893548b9522c46fdcbd8f63385eb8bfb68vboxsync if ((flags & WC_NO_BEST_FIT_CHARS) || ch == table->info.def_char)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* check if char maps back to the same Unicode value */
af062818b47340eef15700d2f0211576ba3506eevboxsync if (ch & 0xff00)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync unsigned char off = table->cp2uni_leadbytes[ch >> 8];
af062818b47340eef15700d2f0211576ba3506eevboxsync return (table->cp2uni[(off << 8) + (ch & 0xff)] == wch);
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync return (table->cp2uni[ch & 0xff] == wch);
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync return 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* query necessary dst length for src string */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic int get_length_dbcs( const struct dbcs_table *table, int flags,
af062818b47340eef15700d2f0211576ba3506eevboxsync const WCHAR *src, unsigned int srclen,
af062818b47340eef15700d2f0211576ba3506eevboxsync const char *defchar, int *used )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_low = table->uni2cp_low;
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_high = table->uni2cp_high;
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR defchar_value = table->info.def_char;
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR composed;
af062818b47340eef15700d2f0211576ba3506eevboxsync int len, tmp;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!defchar && !used && !(flags & WC_COMPOSITECHECK))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync for (len = 0; srclen; srclen--, src++, len++)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync if (uni2cp_low[uni2cp_high[*src >> 8] + (*src & 0xff)] & 0xff00) len++;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync return len;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (defchar) defchar_value = defchar[1] ? ((defchar[0] << 8) | defchar[1]) : defchar[0];
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!used) used = &tmp; /* avoid checking on every char */
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 0;
af062818b47340eef15700d2f0211576ba3506eevboxsync for (len = 0; srclen; len++, srclen--, src++)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync unsigned short res;
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR wch = *src;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if ((flags & WC_COMPOSITECHECK) && (srclen > 1) && (composed = compose(src)))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* now check if we can use the composed char */
af062818b47340eef15700d2f0211576ba3506eevboxsync res = uni2cp_low[uni2cp_high[composed >> 8] + (composed & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (is_valid_dbcs_mapping( table, flags, composed, res ))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* we have a good mapping for the composed char, use it */
af062818b47340eef15700d2f0211576ba3506eevboxsync if (res & 0xff00) len++;
af062818b47340eef15700d2f0211576ba3506eevboxsync src++;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync continue;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync /* no mapping for the composed char, check the other flags */
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags & WC_DEFAULTCHAR) /* use the default char instead */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync if (defchar_value & 0xff00) len++;
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync src++; /* skip the non-spacing char */
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync continue;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags & WC_DISCARDNS) /* skip the second char of the composition */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync src++;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync /* WC_SEPCHARS is the default */
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync res = uni2cp_low[uni2cp_high[wch >> 8] + (wch & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!is_valid_dbcs_mapping( table, flags, wch, res ))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync res = defchar_value;
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (res & 0xff00) len++;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync return len;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* wcstombs for double-byte code page */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic inline int wcstombs_dbcs( const struct dbcs_table *table,
af062818b47340eef15700d2f0211576ba3506eevboxsync const WCHAR *src, unsigned int srclen,
af062818b47340eef15700d2f0211576ba3506eevboxsync char *dst, unsigned int dstlen )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_low = table->uni2cp_low;
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_high = table->uni2cp_high;
af062818b47340eef15700d2f0211576ba3506eevboxsync int len;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync for (len = dstlen; srclen && len; len--, srclen--, src++)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync unsigned short res = uni2cp_low[uni2cp_high[*src >> 8] + (*src & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync if (res & 0xff00)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync if (len == 1) break; /* do not output a partial char */
af062818b47340eef15700d2f0211576ba3506eevboxsync len--;
af062818b47340eef15700d2f0211576ba3506eevboxsync *dst++ = res >> 8;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync *dst++ = (char)res;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (srclen) return -1; /* overflow */
af062818b47340eef15700d2f0211576ba3506eevboxsync return dstlen - len;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* slow version of wcstombs_dbcs that handles the various flags */
af062818b47340eef15700d2f0211576ba3506eevboxsyncstatic int wcstombs_dbcs_slow( const struct dbcs_table *table, int flags,
af062818b47340eef15700d2f0211576ba3506eevboxsync const WCHAR *src, unsigned int srclen,
af062818b47340eef15700d2f0211576ba3506eevboxsync char *dst, unsigned int dstlen,
af062818b47340eef15700d2f0211576ba3506eevboxsync const char *defchar, int *used )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_low = table->uni2cp_low;
af062818b47340eef15700d2f0211576ba3506eevboxsync const unsigned short * const uni2cp_high = table->uni2cp_high;
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR defchar_value = table->info.def_char;
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR composed;
af062818b47340eef15700d2f0211576ba3506eevboxsync int len, tmp;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (defchar) defchar_value = defchar[1] ? ((defchar[0] << 8) | defchar[1]) : defchar[0];
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!used) used = &tmp; /* avoid checking on every char */
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 0;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync for (len = dstlen; srclen && len; len--, srclen--, src++)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync unsigned short res;
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR wch = *src;
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if ((flags & WC_COMPOSITECHECK) && (srclen > 1) && (composed = compose(src)))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* now check if we can use the composed char */
af062818b47340eef15700d2f0211576ba3506eevboxsync res = uni2cp_low[uni2cp_high[composed >> 8] + (composed & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync if (is_valid_dbcs_mapping( table, flags, composed, res ))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync /* we have a good mapping for the composed char, use it */
af062818b47340eef15700d2f0211576ba3506eevboxsync src++;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync goto output_char;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync /* no mapping for the composed char, check the other flags */
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags & WC_DEFAULTCHAR) /* use the default char instead */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync res = defchar_value;
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync src++; /* skip the non-spacing char */
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync goto output_char;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags & WC_DISCARDNS) /* skip the second char of the composition */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync src++;
af062818b47340eef15700d2f0211576ba3506eevboxsync srclen--;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync /* WC_SEPCHARS is the default */
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync res = uni2cp_low[uni2cp_high[wch >> 8] + (wch & 0xff)];
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!is_valid_dbcs_mapping( table, flags, wch, res ))
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync res = defchar_value;
af062818b47340eef15700d2f0211576ba3506eevboxsync *used = 1;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync output_char:
af062818b47340eef15700d2f0211576ba3506eevboxsync if (res & 0xff00)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync if (len == 1) break; /* do not output a partial char */
af062818b47340eef15700d2f0211576ba3506eevboxsync len--;
af062818b47340eef15700d2f0211576ba3506eevboxsync *dst++ = res >> 8;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync *dst++ = (char)res;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (srclen) return -1; /* overflow */
af062818b47340eef15700d2f0211576ba3506eevboxsync return dstlen - len;
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* wide char to multi byte string conversion */
af062818b47340eef15700d2f0211576ba3506eevboxsync/* return -1 on dst buffer overflow */
af062818b47340eef15700d2f0211576ba3506eevboxsyncint wine_cp_wcstombs( const union cptable *table, int flags,
af062818b47340eef15700d2f0211576ba3506eevboxsync const WCHAR *src, int srclen,
af062818b47340eef15700d2f0211576ba3506eevboxsync char *dst, int dstlen, const char *defchar, int *used )
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync if (table->info.char_size == 1)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags || defchar || used)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!dstlen) return get_length_sbcs( &table->sbcs, flags, src, srclen, used );
af062818b47340eef15700d2f0211576ba3506eevboxsync return wcstombs_sbcs_slow( &table->sbcs, flags, src, srclen,
af062818b47340eef15700d2f0211576ba3506eevboxsync dst, dstlen, defchar, used );
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!dstlen) return srclen;
af062818b47340eef15700d2f0211576ba3506eevboxsync return wcstombs_sbcs( &table->sbcs, src, srclen, dst, dstlen );
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync else /* mbcs */
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync if (!dstlen) return get_length_dbcs( &table->dbcs, flags, src, srclen, defchar, used );
af062818b47340eef15700d2f0211576ba3506eevboxsync if (flags || defchar || used)
af062818b47340eef15700d2f0211576ba3506eevboxsync return wcstombs_dbcs_slow( &table->dbcs, flags, src, srclen,
af062818b47340eef15700d2f0211576ba3506eevboxsync dst, dstlen, defchar, used );
af062818b47340eef15700d2f0211576ba3506eevboxsync return wcstombs_dbcs( &table->dbcs, src, srclen, dst, dstlen );
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync}
af062818b47340eef15700d2f0211576ba3506eevboxsync
af062818b47340eef15700d2f0211576ba3506eevboxsync/* CP_SYMBOL implementation */
af062818b47340eef15700d2f0211576ba3506eevboxsync/* return -1 on dst buffer overflow, -2 on invalid character */
af062818b47340eef15700d2f0211576ba3506eevboxsyncint wine_cpsymbol_wcstombs( const WCHAR *src, int srclen, char *dst, int dstlen)
af062818b47340eef15700d2f0211576ba3506eevboxsync{
af062818b47340eef15700d2f0211576ba3506eevboxsync int len, i;
af062818b47340eef15700d2f0211576ba3506eevboxsync if( dstlen == 0) return srclen;
af062818b47340eef15700d2f0211576ba3506eevboxsync len = dstlen > srclen ? srclen : dstlen;
af062818b47340eef15700d2f0211576ba3506eevboxsync for( i = 0; i < len; i++)
af062818b47340eef15700d2f0211576ba3506eevboxsync {
af062818b47340eef15700d2f0211576ba3506eevboxsync WCHAR w = src [ i ];
af062818b47340eef15700d2f0211576ba3506eevboxsync if( w < 0x20 )
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[i] = w;
af062818b47340eef15700d2f0211576ba3506eevboxsync else if( w >= 0xf020 && w < 0xf100)
af062818b47340eef15700d2f0211576ba3506eevboxsync dst[i] = w - 0xf000;
af062818b47340eef15700d2f0211576ba3506eevboxsync else
af062818b47340eef15700d2f0211576ba3506eevboxsync return -2;
af062818b47340eef15700d2f0211576ba3506eevboxsync }
af062818b47340eef15700d2f0211576ba3506eevboxsync if( srclen > len) return -1;
af062818b47340eef15700d2f0211576ba3506eevboxsync return len;
af062818b47340eef15700d2f0211576ba3506eevboxsync}