Allow DW_ATE_UTF for Rust characters
authorTom Tromey <tom@tromey.com>
Sun, 31 Oct 2021 16:34:50 +0000 (10:34 -0600)
committerTom Tromey <tromey@adacore.com>
Mon, 29 Nov 2021 20:26:44 +0000 (13:26 -0700)
commit29b161c9be240da341910f0206ffdd881daacd96
tree1cbb5a9eef79ffa284fd8aa11c6046f82f552ecc
parenta15b33284f4e56064b59d277e95f890350b485d1
Allow DW_ATE_UTF for Rust characters

The Rust compiler plans to change the encoding of a Rust 'char' type
to use DW_ATE_UTF.  You can see the discussion here:

    https://github.com/rust-lang/rust/pull/89887

However, this fails in gdb.  I looked into this, and it turns out that
the handling of DW_ATE_UTF is currently fairly specific to C++.  In
particular, the code here assumes the C++ type names, and it creates
an integer type.

This comes from commit 53e710acd ("GDB thinks char16_t and char32_t
are signed in C++").  The message says:

    Both places need fixing.  But since I couldn't tell why dwarf2read.c
    needs to create a new type, I've made it use the per-arch built-in
    types instead, so that the types are only created once per arch
    instead of once per objfile.  That seems to work fine.

... which is fine, but it seems to me that it's also correct to make a
new character type; and this approach is better because it preserves
the type name as well.  This does use more memory, but first we
shouldn't be too concerned about the memory use of types coming from
debuginfo; and second, if we are, we should implement type interning
anyway.

Changing this code to use a character type revealed a couple of
oddities in the C/C++ handling of TYPE_CODE_CHAR.  This patch fixes
these as well.

I filed PR rust/28637 for this issue, so that this patch can be
backported to the gdb 11 branch.

(cherry picked from commit 1c0e43634cfdd0ad7ef9ac3dd7d208dddeb80f5e)
gdb/c-lang.c
gdb/c-valprint.c
gdb/dwarf2/read.c
gdb/testsuite/gdb.dwarf2/utf-rust.exp [new file with mode: 0644]
This page took 0.026405 seconds and 4 git commands to generate.