oracle__compat_8c_source.html

/*-------------------------------------------------------------------------

 * oracle_compat.c

 *  Oracle compatible functions.

 *

 * Copyright (c) 1996-2025, PostgreSQL Global Development Group

 *

 *  Author: Edmund Mergl <E.Mergl@bawue.de>

 *  Multibyte enhancement: Tatsuo Ishii <ishii@postgresql.org>

 *

 *

 * IDENTIFICATION

 *  src/backend/utils/adt/oracle_compat.c

 *

 *-------------------------------------------------------------------------

 */

#include "postgres.h"


#include "common/int.h"

#include "mb/pg_wchar.h"

#include "miscadmin.h"

#include "utils/builtins.h"

#include "utils/formatting.h"

#include "utils/memutils.h"

#include "varatt.h"


static text *dotrim(const char *string, int stringlen,

                    const char *set, int setlen,

                    bool doltrim, bool dortrim);

static bytea *dobyteatrim(bytea *string, bytea *set,

                          bool doltrim, bool dortrim);


/********************************************************************

 *

 * lower

 *

 * Syntax:

 *

 *   text lower(text string)

 *

 * Purpose:

 *

 *   Returns string, with all letters forced to lowercase.

 *

 ********************************************************************/


Datum

lower(PG_FUNCTION_ARGS)

{

    text       *in_string = PG_GETARG_TEXT_PP(0);

    char       *out_string;

    text       *result;


    out_string = str_tolower(VARDATA_ANY(in_string),

                             VARSIZE_ANY_EXHDR(in_string),

                             PG_GET_COLLATION());

    result = cstring_to_text(out_string);

    pfree(out_string);


    PG_RETURN_TEXT_P(result);

}


/********************************************************************

 *

 * upper

 *

 * Syntax:

 *

 *   text upper(text string)

 *

 * Purpose:

 *

 *   Returns string, with all letters forced to uppercase.

 *

 ********************************************************************/


Datum

upper(PG_FUNCTION_ARGS)

{

    text       *in_string = PG_GETARG_TEXT_PP(0);

    char       *out_string;

    text       *result;


    out_string = str_toupper(VARDATA_ANY(in_string),

                             VARSIZE_ANY_EXHDR(in_string),

                             PG_GET_COLLATION());

    result = cstring_to_text(out_string);

    pfree(out_string);


    PG_RETURN_TEXT_P(result);

}


/********************************************************************

 *

 * initcap

 *

 * Syntax:

 *

 *   text initcap(text string)

 *

 * Purpose:

 *

 *   Returns string, with first letter of each word in uppercase, all

 *   other letters in lowercase. A word is defined as a sequence of

 *   alphanumeric characters, delimited by non-alphanumeric

 *   characters.

 *

 ********************************************************************/


Datum

initcap(PG_FUNCTION_ARGS)

{

    text       *in_string = PG_GETARG_TEXT_PP(0);

    char       *out_string;

    text       *result;


    out_string = str_initcap(VARDATA_ANY(in_string),

                             VARSIZE_ANY_EXHDR(in_string),

                             PG_GET_COLLATION());

    result = cstring_to_text(out_string);

    pfree(out_string);


    PG_RETURN_TEXT_P(result);

}


Datum

casefold(PG_FUNCTION_ARGS)

{

    text       *in_string = PG_GETARG_TEXT_PP(0);

    char       *out_string;

    text       *result;


    out_string = str_casefold(VARDATA_ANY(in_string),

                              VARSIZE_ANY_EXHDR(in_string),

                              PG_GET_COLLATION());

    result = cstring_to_text(out_string);

    pfree(out_string);


    PG_RETURN_TEXT_P(result);

}


/********************************************************************

 *

 * lpad

 *

 * Syntax:

 *

 *   text lpad(text string1, int4 len, text string2)

 *

 * Purpose:

 *

 *   Returns string1, left-padded to length len with the sequence of

 *   characters in string2.  If len is less than the length of string1,

 *   instead truncate (on the right) to len.

 *

 ********************************************************************/


Datum

lpad(PG_FUNCTION_ARGS)

{

    text       *string1 = PG_GETARG_TEXT_PP(0);

    int32       len = PG_GETARG_INT32(1);

    text       *string2 = PG_GETARG_TEXT_PP(2);

    text       *ret;

    char       *ptr1,

               *ptr2,

               *ptr2start,

               *ptr2end,

               *ptr_ret;

    int         m,

                s1len,

                s2len;

    int         bytelen;


    /* Negative len is silently taken as zero */

    if (len < 0)

        len = 0;


    s1len = VARSIZE_ANY_EXHDR(string1);

    if (s1len < 0)

        s1len = 0;              /* shouldn't happen */


    s2len = VARSIZE_ANY_EXHDR(string2);

    if (s2len < 0)

        s2len = 0;              /* shouldn't happen */


    s1len = pg_mbstrlen_with_len(VARDATA_ANY(string1), s1len);


    if (s1len > len)

        s1len = len;            /* truncate string1 to len chars */


    if (s2len <= 0)

        len = s1len;            /* nothing to pad with, so don't pad */


    /* compute worst-case output length */

    if (unlikely(pg_mul_s32_overflow(pg_database_encoding_max_length(), len,

                                     &bytelen)) ||

        unlikely(pg_add_s32_overflow(bytelen, VARHDRSZ, &bytelen)) ||

        unlikely(!AllocSizeIsValid(bytelen)))

        ereport(ERROR,

                (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                 errmsg("requested length too large")));


    ret = (text *) palloc(bytelen);


    m = len - s1len;


    ptr2 = ptr2start = VARDATA_ANY(string2);

    ptr2end = ptr2 + s2len;

    ptr_ret = VARDATA(ret);


    while (m--)

    {

        int         mlen = pg_mblen(ptr2);


        memcpy(ptr_ret, ptr2, mlen);

        ptr_ret += mlen;

        ptr2 += mlen;

        if (ptr2 == ptr2end)    /* wrap around at end of s2 */

            ptr2 = ptr2start;

    }


    ptr1 = VARDATA_ANY(string1);


    while (s1len--)

    {

        int         mlen = pg_mblen(ptr1);


        memcpy(ptr_ret, ptr1, mlen);

        ptr_ret += mlen;

        ptr1 += mlen;

    }


    SET_VARSIZE(ret, ptr_ret - (char *) ret);


    PG_RETURN_TEXT_P(ret);

}


/********************************************************************

 *

 * rpad

 *

 * Syntax:

 *

 *   text rpad(text string1, int4 len, text string2)

 *

 * Purpose:

 *

 *   Returns string1, right-padded to length len with the sequence of

 *   characters in string2.  If len is less than the length of string1,

 *   instead truncate (on the right) to len.

 *

 ********************************************************************/


Datum

rpad(PG_FUNCTION_ARGS)

{

    text       *string1 = PG_GETARG_TEXT_PP(0);

    int32       len = PG_GETARG_INT32(1);

    text       *string2 = PG_GETARG_TEXT_PP(2);

    text       *ret;

    char       *ptr1,

               *ptr2,

               *ptr2start,

               *ptr2end,

               *ptr_ret;

    int         m,

                s1len,

                s2len;

    int         bytelen;


    /* Negative len is silently taken as zero */

    if (len < 0)

        len = 0;


    s1len = VARSIZE_ANY_EXHDR(string1);

    if (s1len < 0)

        s1len = 0;              /* shouldn't happen */


    s2len = VARSIZE_ANY_EXHDR(string2);

    if (s2len < 0)

        s2len = 0;              /* shouldn't happen */


    s1len = pg_mbstrlen_with_len(VARDATA_ANY(string1), s1len);


    if (s1len > len)

        s1len = len;            /* truncate string1 to len chars */


    if (s2len <= 0)

        len = s1len;            /* nothing to pad with, so don't pad */


    /* compute worst-case output length */

    if (unlikely(pg_mul_s32_overflow(pg_database_encoding_max_length(), len,

                                     &bytelen)) ||

        unlikely(pg_add_s32_overflow(bytelen, VARHDRSZ, &bytelen)) ||

        unlikely(!AllocSizeIsValid(bytelen)))

        ereport(ERROR,

                (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                 errmsg("requested length too large")));


    ret = (text *) palloc(bytelen);


    m = len - s1len;


    ptr1 = VARDATA_ANY(string1);

    ptr_ret = VARDATA(ret);


    while (s1len--)

    {

        int         mlen = pg_mblen(ptr1);


        memcpy(ptr_ret, ptr1, mlen);

        ptr_ret += mlen;

        ptr1 += mlen;

    }


    ptr2 = ptr2start = VARDATA_ANY(string2);

    ptr2end = ptr2 + s2len;


    while (m--)

    {

        int         mlen = pg_mblen(ptr2);


        memcpy(ptr_ret, ptr2, mlen);

        ptr_ret += mlen;

        ptr2 += mlen;

        if (ptr2 == ptr2end)    /* wrap around at end of s2 */

            ptr2 = ptr2start;

    }


    SET_VARSIZE(ret, ptr_ret - (char *) ret);


    PG_RETURN_TEXT_P(ret);

}


/********************************************************************

 *

 * btrim

 *

 * Syntax:

 *

 *   text btrim(text string, text set)

 *

 * Purpose:

 *

 *   Returns string with characters removed from the front and back

 *   up to the first character not in set.

 *

 ********************************************************************/


Datum

btrim(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    text       *set = PG_GETARG_TEXT_PP(1);

    text       *ret;


    ret = dotrim(VARDATA_ANY(string), VARSIZE_ANY_EXHDR(string),

                 VARDATA_ANY(set), VARSIZE_ANY_EXHDR(set),

                 true, true);


    PG_RETURN_TEXT_P(ret);

}


/********************************************************************

 *

 * btrim1 --- btrim with set fixed as ' '

 *

 ********************************************************************/


Datum

btrim1(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    text       *ret;


    ret = dotrim(VARDATA_ANY(string), VARSIZE_ANY_EXHDR(string),

                 " ", 1,

                 true, true);


    PG_RETURN_TEXT_P(ret);

}


/*

 * Common implementation for btrim, ltrim, rtrim

 */

static text *

dotrim(const char *string, int stringlen,

       const char *set, int setlen,

       bool doltrim, bool dortrim)

{

    int         i;


    /* Nothing to do if either string or set is empty */

    if (stringlen > 0 && setlen > 0)

    {

        if (pg_database_encoding_max_length() > 1)

        {

            /*

             * In the multibyte-encoding case, build arrays of pointers to

             * character starts, so that we can avoid inefficient checks in

             * the inner loops.

             */

            const char **stringchars;

            const char **setchars;

            int        *stringmblen;

            int        *setmblen;

            int         stringnchars;

            int         setnchars;

            int         resultndx;

            int         resultnchars;

            const char *p;

            int         len;

            int         mblen;

            const char *str_pos;

            int         str_len;


            stringchars = (const char **) palloc(stringlen * sizeof(char *));

            stringmblen = (int *) palloc(stringlen * sizeof(int));

            stringnchars = 0;

            p = string;

            len = stringlen;

            while (len > 0)

            {

                stringchars[stringnchars] = p;

                stringmblen[stringnchars] = mblen = pg_mblen(p);

                stringnchars++;

                p += mblen;

                len -= mblen;

            }


            setchars = (const char **) palloc(setlen * sizeof(char *));

            setmblen = (int *) palloc(setlen * sizeof(int));

            setnchars = 0;

            p = set;

            len = setlen;

            while (len > 0)

            {

                setchars[setnchars] = p;

                setmblen[setnchars] = mblen = pg_mblen(p);

                setnchars++;

                p += mblen;

                len -= mblen;

            }


            resultndx = 0;      /* index in stringchars[] */

            resultnchars = stringnchars;


            if (doltrim)

            {

                while (resultnchars > 0)

                {

                    str_pos = stringchars[resultndx];

                    str_len = stringmblen[resultndx];

                    for (i = 0; i < setnchars; i++)

                    {

                        if (str_len == setmblen[i] &&

                            memcmp(str_pos, setchars[i], str_len) == 0)

                            break;

                    }

                    if (i >= setnchars)

                        break;  /* no match here */

                    string += str_len;

                    stringlen -= str_len;

                    resultndx++;

                    resultnchars--;

                }

            }


            if (dortrim)

            {

                while (resultnchars > 0)

                {

                    str_pos = stringchars[resultndx + resultnchars - 1];

                    str_len = stringmblen[resultndx + resultnchars - 1];

                    for (i = 0; i < setnchars; i++)

                    {

                        if (str_len == setmblen[i] &&

                            memcmp(str_pos, setchars[i], str_len) == 0)

                            break;

                    }

                    if (i >= setnchars)

                        break;  /* no match here */

                    stringlen -= str_len;

                    resultnchars--;

                }

            }


            pfree(stringchars);

            pfree(stringmblen);

            pfree(setchars);

            pfree(setmblen);

        }

        else

        {

            /*

             * In the single-byte-encoding case, we don't need such overhead.

             */

            if (doltrim)

            {

                while (stringlen > 0)

                {

                    char        str_ch = *string;


                    for (i = 0; i < setlen; i++)

                    {

                        if (str_ch == set[i])

                            break;

                    }

                    if (i >= setlen)

                        break;  /* no match here */

                    string++;

                    stringlen--;

                }

            }


            if (dortrim)

            {

                while (stringlen > 0)

                {

                    char        str_ch = string[stringlen - 1];


                    for (i = 0; i < setlen; i++)

                    {

                        if (str_ch == set[i])

                            break;

                    }

                    if (i >= setlen)

                        break;  /* no match here */

                    stringlen--;

                }

            }

        }

    }


    /* Return selected portion of string */

    return cstring_to_text_with_len(string, stringlen);

}


/*

 * Common implementation for bytea versions of btrim, ltrim, rtrim

 */

bytea *

dobyteatrim(bytea *string, bytea *set, bool doltrim, bool dortrim)

{

    bytea      *ret;

    char       *ptr,

               *end,

               *ptr2,

               *ptr2start,

               *end2;

    int         m,

                stringlen,

                setlen;


    stringlen = VARSIZE_ANY_EXHDR(string);

    setlen = VARSIZE_ANY_EXHDR(set);


    if (stringlen <= 0 || setlen <= 0)

        return string;


    m = stringlen;

    ptr = VARDATA_ANY(string);

    end = ptr + stringlen - 1;

    ptr2start = VARDATA_ANY(set);

    end2 = ptr2start + setlen - 1;


    if (doltrim)

    {

        while (m > 0)

        {

            ptr2 = ptr2start;

            while (ptr2 <= end2)

            {

                if (*ptr == *ptr2)

                    break;

                ++ptr2;

            }

            if (ptr2 > end2)

                break;

            ptr++;

            m--;

        }

    }


    if (dortrim)

    {

        while (m > 0)

        {

            ptr2 = ptr2start;

            while (ptr2 <= end2)

            {

                if (*end == *ptr2)

                    break;

                ++ptr2;

            }

            if (ptr2 > end2)

                break;

            end--;

            m--;

        }

    }


    ret = (bytea *) palloc(VARHDRSZ + m);

    SET_VARSIZE(ret, VARHDRSZ + m);

    memcpy(VARDATA(ret), ptr, m);

    return ret;

}


/********************************************************************

 *

 * byteatrim

 *

 * Syntax:

 *

 *   bytea byteatrim(bytea string, bytea set)

 *

 * Purpose:

 *

 *   Returns string with characters removed from the front and back

 *   up to the first character not in set.

 *

 * Cloned from btrim and modified as required.

 ********************************************************************/


Datum

byteatrim(PG_FUNCTION_ARGS)

{

    bytea      *string = PG_GETARG_BYTEA_PP(0);

    bytea      *set = PG_GETARG_BYTEA_PP(1);

    bytea      *ret;


    ret = dobyteatrim(string, set, true, true);


    PG_RETURN_BYTEA_P(ret);

}


/********************************************************************

 *

 * bytealtrim

 *

 * Syntax:

 *

 *   bytea bytealtrim(bytea string, bytea set)

 *

 * Purpose:

 *

 *   Returns string with initial characters removed up to the first

 *   character not in set.

 *

 ********************************************************************/


Datum

bytealtrim(PG_FUNCTION_ARGS)

{

    bytea      *string = PG_GETARG_BYTEA_PP(0);

    bytea      *set = PG_GETARG_BYTEA_PP(1);

    bytea      *ret;


    ret = dobyteatrim(string, set, true, false);


    PG_RETURN_BYTEA_P(ret);

}


/********************************************************************

 *

 * byteartrim

 *

 * Syntax:

 *

 *   bytea byteartrim(bytea string, bytea set)

 *

 * Purpose:

 *

 *   Returns string with final characters removed after the last

 *   character not in set.

 *

 ********************************************************************/


Datum

byteartrim(PG_FUNCTION_ARGS)

{

    bytea      *string = PG_GETARG_BYTEA_PP(0);

    bytea      *set = PG_GETARG_BYTEA_PP(1);

    bytea      *ret;


    ret = dobyteatrim(string, set, false, true);


    PG_RETURN_BYTEA_P(ret);

}


/********************************************************************

 *

 * ltrim

 *

 * Syntax:

 *

 *   text ltrim(text string, text set)

 *

 * Purpose:

 *

 *   Returns string with initial characters removed up to the first

 *   character not in set.

 *

 ********************************************************************/


Datum

ltrim(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    text       *set = PG_GETARG_TEXT_PP(1);

    text       *ret;


    ret = dotrim(VARDATA_ANY(string), VARSIZE_ANY_EXHDR(string),

                 VARDATA_ANY(set), VARSIZE_ANY_EXHDR(set),

                 true, false);


    PG_RETURN_TEXT_P(ret);

}


/********************************************************************

 *

 * ltrim1 --- ltrim with set fixed as ' '

 *

 ********************************************************************/


Datum

ltrim1(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    text       *ret;


    ret = dotrim(VARDATA_ANY(string), VARSIZE_ANY_EXHDR(string),

                 " ", 1,

                 true, false);


    PG_RETURN_TEXT_P(ret);

}


/********************************************************************

 *

 * rtrim

 *

 * Syntax:

 *

 *   text rtrim(text string, text set)

 *

 * Purpose:

 *

 *   Returns string with final characters removed after the last

 *   character not in set.

 *

 ********************************************************************/


Datum

rtrim(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    text       *set = PG_GETARG_TEXT_PP(1);

    text       *ret;


    ret = dotrim(VARDATA_ANY(string), VARSIZE_ANY_EXHDR(string),

                 VARDATA_ANY(set), VARSIZE_ANY_EXHDR(set),

                 false, true);


    PG_RETURN_TEXT_P(ret);

}


/********************************************************************

 *

 * rtrim1 --- rtrim with set fixed as ' '

 *

 ********************************************************************/


Datum

rtrim1(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    text       *ret;


    ret = dotrim(VARDATA_ANY(string), VARSIZE_ANY_EXHDR(string),

                 " ", 1,

                 false, true);


    PG_RETURN_TEXT_P(ret);

}


/********************************************************************

 *

 * translate

 *

 * Syntax:

 *

 *   text translate(text string, text from, text to)

 *

 * Purpose:

 *

 *   Returns string after replacing all occurrences of characters in from

 *   with the corresponding character in to.  If from is longer than to,

 *   occurrences of the extra characters in from are deleted.

 *   Improved by Edwin Ramirez <ramirez@doc.mssm.edu>.

 *

 ********************************************************************/


Datum

translate(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    text       *from = PG_GETARG_TEXT_PP(1);

    text       *to = PG_GETARG_TEXT_PP(2);

    text       *result;

    char       *from_ptr,

               *to_ptr,

               *to_end;

    char       *source,

               *target;

    int         m,

                fromlen,

                tolen,

                retlen,

                i;

    int         bytelen;

    int         len;

    int         source_len;

    int         from_index;


    m = VARSIZE_ANY_EXHDR(string);

    if (m <= 0)

        PG_RETURN_TEXT_P(string);

    source = VARDATA_ANY(string);


    fromlen = VARSIZE_ANY_EXHDR(from);

    from_ptr = VARDATA_ANY(from);

    tolen = VARSIZE_ANY_EXHDR(to);

    to_ptr = VARDATA_ANY(to);

    to_end = to_ptr + tolen;


    /*

     * The worst-case expansion is to substitute a max-length character for a

     * single-byte character at each position of the string.

     */

    if (unlikely(pg_mul_s32_overflow(pg_database_encoding_max_length(), m,

                                     &bytelen)) ||

        unlikely(pg_add_s32_overflow(bytelen, VARHDRSZ, &bytelen)) ||

        unlikely(!AllocSizeIsValid(bytelen)))

        ereport(ERROR,

                (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                 errmsg("requested length too large")));


    result = (text *) palloc(bytelen);


    target = VARDATA(result);

    retlen = 0;


    while (m > 0)

    {

        source_len = pg_mblen(source);

        from_index = 0;


        for (i = 0; i < fromlen; i += len)

        {

            len = pg_mblen(&from_ptr[i]);

            if (len == source_len &&

                memcmp(source, &from_ptr[i], len) == 0)

                break;


            from_index++;

        }

        if (i < fromlen)

        {

            /* substitute, or delete if no corresponding "to" character */

            char       *p = to_ptr;


            for (i = 0; i < from_index; i++)

            {

                if (p >= to_end)

                    break;

                p += pg_mblen(p);

            }

            if (p < to_end)

            {

                len = pg_mblen(p);

                memcpy(target, p, len);

                target += len;

                retlen += len;

            }

        }

        else

        {

            /* no match, so copy */

            memcpy(target, source, source_len);

            target += source_len;

            retlen += source_len;

        }


        source += source_len;

        m -= source_len;

    }


    SET_VARSIZE(result, retlen + VARHDRSZ);


    /*

     * The function result is probably much bigger than needed, if we're using

     * a multibyte encoding, but it's not worth reallocating it; the result

     * probably won't live long anyway.

     */


    PG_RETURN_TEXT_P(result);

}


/********************************************************************

 *

 * ascii

 *

 * Syntax:

 *

 *   int ascii(text string)

 *

 * Purpose:

 *

 *   Returns the decimal representation of the first character from

 *   string.

 *   If the string is empty we return 0.

 *   If the database encoding is UTF8, we return the Unicode codepoint.

 *   If the database encoding is any other multi-byte encoding, we

 *   return the value of the first byte if it is an ASCII character

 *   (range 1 .. 127), or raise an error.

 *   For all other encodings we return the value of the first byte,

 *   (range 1..255).

 *

 ********************************************************************/


Datum

ascii(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    int         encoding = GetDatabaseEncoding();

    unsigned char *data;


    if (VARSIZE_ANY_EXHDR(string) <= 0)

        PG_RETURN_INT32(0);


    data = (unsigned char *) VARDATA_ANY(string);


    if (encoding == PG_UTF8 && *data > 127)

    {

        /* return the code point for Unicode */


        int         result = 0,

                    tbytes = 0,

                    i;


        if (*data >= 0xF0)

        {

            result = *data & 0x07;

            tbytes = 3;

        }

        else if (*data >= 0xE0)

        {

            result = *data & 0x0F;

            tbytes = 2;

        }

        else

        {

            Assert(*data > 0xC0);

            result = *data & 0x1f;

            tbytes = 1;

        }


        Assert(tbytes > 0);


        for (i = 1; i <= tbytes; i++)

        {

            Assert((data[i] & 0xC0) == 0x80);

            result = (result << 6) + (data[i] & 0x3f);

        }


        PG_RETURN_INT32(result);

    }

    else

    {

        if (pg_encoding_max_length(encoding) > 1 && *data > 127)

            ereport(ERROR,

                    (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                     errmsg("requested character too large")));


        PG_RETURN_INT32((int32) *data);

    }

}


/********************************************************************

 *

 * chr

 *

 * Syntax:

 *

 *   text chr(int val)

 *

 * Purpose:

 *

 *  Returns the character having the binary equivalent to val.

 *

 * For UTF8 we treat the argument as a Unicode code point.

 * For other multi-byte encodings we raise an error for arguments

 * outside the strict ASCII range (1..127).

 *

 * It's important that we don't ever return a value that is not valid

 * in the database encoding, so that this doesn't become a way for

 * invalid data to enter the database.

 *

 ********************************************************************/


Datum

chr         (PG_FUNCTION_ARGS)

{

    int32       arg = PG_GETARG_INT32(0);

    uint32      cvalue;

    text       *result;

    int         encoding = GetDatabaseEncoding();


    /*

     * Error out on arguments that make no sense or that we can't validly

     * represent in the encoding.

     */

    if (arg < 0)

        ereport(ERROR,

                (errcode(ERRCODE_INVALID_PARAMETER_VALUE),

                 errmsg("character number must be positive")));

    else if (arg == 0)

        ereport(ERROR,

                (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                 errmsg("null character not permitted")));


    cvalue = arg;


    if (encoding == PG_UTF8 && cvalue > 127)

    {

        /* for Unicode we treat the argument as a code point */

        int         bytes;

        unsigned char *wch;


        /*

         * We only allow valid Unicode code points; per RFC3629 that stops at

         * U+10FFFF, even though 4-byte UTF8 sequences can hold values up to

         * U+1FFFFF.

         */

        if (cvalue > 0x0010ffff)

            ereport(ERROR,

                    (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                     errmsg("requested character too large for encoding: %u",

                            cvalue)));


        if (cvalue > 0xffff)

            bytes = 4;

        else if (cvalue > 0x07ff)

            bytes = 3;

        else

            bytes = 2;


        result = (text *) palloc(VARHDRSZ + bytes);

        SET_VARSIZE(result, VARHDRSZ + bytes);

        wch = (unsigned char *) VARDATA(result);


        if (bytes == 2)

        {

            wch[0] = 0xC0 | ((cvalue >> 6) & 0x1F);

            wch[1] = 0x80 | (cvalue & 0x3F);

        }

        else if (bytes == 3)

        {

            wch[0] = 0xE0 | ((cvalue >> 12) & 0x0F);

            wch[1] = 0x80 | ((cvalue >> 6) & 0x3F);

            wch[2] = 0x80 | (cvalue & 0x3F);

        }

        else

        {

            wch[0] = 0xF0 | ((cvalue >> 18) & 0x07);

            wch[1] = 0x80 | ((cvalue >> 12) & 0x3F);

            wch[2] = 0x80 | ((cvalue >> 6) & 0x3F);

            wch[3] = 0x80 | (cvalue & 0x3F);

        }


        /*

         * The preceding range check isn't sufficient, because UTF8 excludes

         * Unicode "surrogate pair" codes.  Make sure what we created is valid

         * UTF8.

         */

        if (!pg_utf8_islegal(wch, bytes))

            ereport(ERROR,

                    (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                     errmsg("requested character not valid for encoding: %u",

                            cvalue)));

    }

    else

    {

        bool        is_mb;


        is_mb = pg_encoding_max_length(encoding) > 1;


        if ((is_mb && (cvalue > 127)) || (!is_mb && (cvalue > 255)))

            ereport(ERROR,

                    (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                     errmsg("requested character too large for encoding: %u",

                            cvalue)));


        result = (text *) palloc(VARHDRSZ + 1);

        SET_VARSIZE(result, VARHDRSZ + 1);

        *VARDATA(result) = (char) cvalue;

    }


    PG_RETURN_TEXT_P(result);

}


/********************************************************************

 *

 * repeat

 *

 * Syntax:

 *

 *   text repeat(text string, int val)

 *

 * Purpose:

 *

 *  Repeat string by val.

 *

 ********************************************************************/


Datum

repeat(PG_FUNCTION_ARGS)

{

    text       *string = PG_GETARG_TEXT_PP(0);

    int32       count = PG_GETARG_INT32(1);

    text       *result;

    int         slen,

                tlen;

    int         i;

    char       *cp,

               *sp;


    if (count < 0)

        count = 0;


    slen = VARSIZE_ANY_EXHDR(string);


    if (unlikely(pg_mul_s32_overflow(count, slen, &tlen)) ||

        unlikely(pg_add_s32_overflow(tlen, VARHDRSZ, &tlen)) ||

        unlikely(!AllocSizeIsValid(tlen)))

        ereport(ERROR,

                (errcode(ERRCODE_PROGRAM_LIMIT_EXCEEDED),

                 errmsg("requested length too large")));


    result = (text *) palloc(tlen);


    SET_VARSIZE(result, tlen);

    cp = VARDATA(result);

    sp = VARDATA_ANY(string);

    for (i = 0; i < count; i++)

    {

        memcpy(cp, sp, slen);

        cp += slen;

        CHECK_FOR_INTERRUPTS();

    }


    PG_RETURN_TEXT_P(result);

}

builtins.h

VARHDRSZ
#define VARHDRSZ
Definition: c.h:663

int32
int32_t int32
Definition: c.h:498

unlikely
#define unlikely(x)
Definition: c.h:347

uint32
uint32_t uint32
Definition: c.h:502

errcode
int errcode(int sqlerrcode)
Definition: elog.c:854

errmsg
int errmsg(const char *fmt,...)
Definition: elog.c:1071

ERROR
#define ERROR
Definition: elog.h:39

ereport
#define ereport(elevel,...)
Definition: elog.h:149

PG_GETARG_BYTEA_PP
#define PG_GETARG_BYTEA_PP(n)
Definition: fmgr.h:308

PG_GETARG_TEXT_PP
#define PG_GETARG_TEXT_PP(n)
Definition: fmgr.h:309

PG_RETURN_BYTEA_P
#define PG_RETURN_BYTEA_P(x)
Definition: fmgr.h:371

PG_RETURN_TEXT_P
#define PG_RETURN_TEXT_P(x)
Definition: fmgr.h:372

PG_RETURN_INT32
#define PG_RETURN_INT32(x)
Definition: fmgr.h:354

PG_GETARG_INT32
#define PG_GETARG_INT32(n)
Definition: fmgr.h:269

PG_GET_COLLATION
#define PG_GET_COLLATION()
Definition: fmgr.h:198

PG_FUNCTION_ARGS
#define PG_FUNCTION_ARGS
Definition: fmgr.h:193

str_initcap
char * str_initcap(const char *buff, size_t nbytes, Oid collid)
Definition: formatting.c:1765

str_casefold
char * str_casefold(const char *buff, size_t nbytes, Oid collid)
Definition: formatting.c:1829

str_toupper
char * str_toupper(const char *buff, size_t nbytes, Oid collid)
Definition: formatting.c:1701

str_tolower
char * str_tolower(const char *buff, size_t nbytes, Oid collid)
Definition: formatting.c:1637

formatting.h

Assert
Assert(PointerIsAligned(start, uint64))

int.h

pg_mul_s32_overflow
static bool pg_mul_s32_overflow(int32 a, int32 b, int32 *result)
Definition: int.h:187

pg_add_s32_overflow
static bool pg_add_s32_overflow(int32 a, int32 b, int32 *result)
Definition: int.h:151

i
int i
Definition: isn.c:77

GetDatabaseEncoding
int GetDatabaseEncoding(void)
Definition: mbutils.c:1262

pg_mbstrlen_with_len
int pg_mbstrlen_with_len(const char *mbstr, int limit)
Definition: mbutils.c:1058

pg_database_encoding_max_length
int pg_database_encoding_max_length(void)
Definition: mbutils.c:1547

pg_mblen
int pg_mblen(const char *mbstr)
Definition: mbutils.c:1024

pfree
void pfree(void *pointer)
Definition: mcxt.c:1528

palloc
void * palloc(Size size)
Definition: mcxt.c:1321

memutils.h

AllocSizeIsValid
#define AllocSizeIsValid(size)
Definition: memutils.h:42

miscadmin.h

CHECK_FOR_INTERRUPTS
#define CHECK_FOR_INTERRUPTS()
Definition: miscadmin.h:122

dotrim
static text * dotrim(const char *string, int stringlen, const char *set, int setlen, bool doltrim, bool dortrim)
Definition: oracle_compat.c:394

bytealtrim
Datum bytealtrim(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:660

ltrim
Datum ltrim(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:714

byteatrim
Datum byteatrim(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:633

lower
Datum lower(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:49

initcap
Datum initcap(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:114

upper
Datum upper(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:80

byteartrim
Datum byteartrim(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:687

rtrim
Datum rtrim(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:762

rpad
Datum rpad(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:261

chr
Datum chr(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:1022

ltrim1
Datum ltrim1(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:734

btrim1
Datum btrim1(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:378

ascii
Datum ascii(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:941

rtrim1
Datum rtrim1(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:782

casefold
Datum casefold(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:130

translate
Datum translate(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:813

dobyteatrim
static bytea * dobyteatrim(bytea *string, bytea *set, bool doltrim, bool dortrim)
Definition: oracle_compat.c:550

lpad
Datum lpad(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:163

btrim
Datum btrim(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:358

repeat
Datum repeat(PG_FUNCTION_ARGS)
Definition: oracle_compat.c:1137

arg
void * arg
Definition: pg_backup_utils.c:29

len
const void size_t len
Definition: pg_crc32c_sse42.c:28

data
const void * data
Definition: pg_crc32c_sse42.c:27

encoding
int32 encoding
Definition: pg_database.h:41

source
static rewind_source * source
Definition: pg_rewind.c:89

pg_wchar.h

PG_UTF8
@ PG_UTF8
Definition: pg_wchar.h:232

postgres.h

Datum
uintptr_t Datum
Definition: postgres.h:69

string
char string[11]
Definition: preproc-type.c:52

varlena
Definition: c.h:658

varatt.h

VARDATA
#define VARDATA(PTR)
Definition: varatt.h:278

VARDATA_ANY
#define VARDATA_ANY(PTR)
Definition: varatt.h:324

SET_VARSIZE
#define SET_VARSIZE(PTR, len)
Definition: varatt.h:305

VARSIZE_ANY_EXHDR
#define VARSIZE_ANY_EXHDR(PTR)
Definition: varatt.h:317

cstring_to_text_with_len
text * cstring_to_text_with_len(const char *s, int len)
Definition: varlena.c:204

cstring_to_text
text * cstring_to_text(const char *s)
Definition: varlena.c:192

pg_utf8_islegal
bool pg_utf8_islegal(const unsigned char *source, int length)
Definition: wchar.c:1989

pg_encoding_max_length
int pg_encoding_max_length(int encoding)
Definition: wchar.c:2213