Rust 字符串的基本操作
当前位置:点晴教程→知识管理交流
→『 技术文档交流 』
Rust 核心语言只有一种字符串类型,那就是字符串切片 str,它的借用形式更常见 &str。 String 类型,不属于核心语言,而是由 Rust 标准库提供。它是一种长度可变、内容可变、拥有所有权的 UTF-8 编码字符串类型。 创建新字符串 String 其实是矢量类型的封装,矢量类型 Vec<T> 的许多操作在 String 上都能找到。比如,创建空白字符串的 new() 方法。 如果想使用现成的字符串初始化 String,可以使用 to_string() 方法。所有实现 Display 特征的类型都有这个方法,比如字符串字面量。 还可以使用 String::from() 创建字符串。 因为字符串基于 UTF-8,你可以在其中存储各国语言,甚至包括 emoji。 更新字符串 使用 push_str(string) 向字符串尾部添加新字符串。参数是字符串切片类型 &str,因此不会占有参数的所有权。 使用 push(ch) 向字符串尾部添加单个字符: 拼接两个 String,可以使用加号 +。加号运算符会调用 add() 函数,其签名如下:
因此,使用 + 执行完拼接操作,原字符串将失去所有权: 当拼接多个字符串,代码写起来很不方便: 此时,使用 format! 宏会更方便。format! 宏的用法 println! 宏的用法类似,只不过不是向终端打印信息,而是返回 String 类型的值。 format! 宏的可读性更好,并且它不会抢夺字符串的所有权,之后可以继续使用原来的字符串。 字符串索引 在其他编程语言,访问字符串索引是个常见操作。但是,如果你在 Rust 中进行此类操作,会得到一个错误: 之所以 Rust 禁止对字符串进行索引操作,是因为 UTF-8 是一种变长编码方案,有的字符使用 1 个字节表示,有的字符则需要 2 个字节甚至更多。因此,索引位置和字符并非一一对应。 为了避免含糊不清,防止可能带来的问题,Rust 干脆禁止在字符串上使用索引值。 Rust 禁用字符串的另一个原因时,索引操作的时间复杂度应当是常量时间O(1)。但这在 UTF-8 中难以实现,因为每次它都需要从头开始遍历,才能发现当前位置属于哪个字符。 字符串切片 如果你确实想截取字符串的一部分,必须要更明确的告知 Rust 编译器,你期望截取的数据类型,是字节、字符、还是图元簇? 比如,你可以使用区间语法 [a..b] 截取特定范围内的字节序列。 如果你截取的字节序列不是一个完整的 UTF-8 编码,Rust 会 panic 退出。使用字符串切片务必小心。 遍历字符串 使用 for 循环字符串时,务必明确你的遍历元素类型。 使用 chars() 返回一个遍历字符的迭代器。 如果想遍历字符串的所有字节,使用 bytes() 方法: 如果你要遍历图元簇,Rust 标准库不提供这种功能,需要去 crates.io 自行解决。 Storing UTF-8 Encoding Text with Strings https://doc.rust-lang.org/stable/book/ch08-02-strings.html 该文章在 2024/12/28 11:54:43 编辑过 |
关键字查询
相关文章
正在查询... |