c++ - std::array 模板实例会占用更多的代码内存吗？

Question

我有一个没有 MMU 的微控制器，但我们使用的是 C 和 C++。

我们正在避免所有动态内存使用（即 no new SomeClass()or malloc()）和大多数标准库。

半问题0：

据我了解std::array，它不使用任何动态内存，所以它的使用应该没问题（它只在堆栈上）。查看std::array源代码，它看起来不错，因为它创建了一个 c 样式的数组，然后在该数组周围包装了功能。

我们使用的芯片有 1MB 的闪存用于存储代码。

问题一：

我担心在其中使用模板std::array会导致二进制文件变大，这可能会导致二进制文件超过 1MB 代码内存限制。

我认为，如果您创建 a 的实例std::array< int, 5 >，那么对其上的所有函数调用都std::array将占用一定数量的代码内存，比如说 X 字节的内存。

如果您创建另一个实例std::array< SomeObject, 5 >，然后调用该实例的函数std::array，这些函数中的每一个现在是否会在二进制文件中重复，从而占用更多代码内存？X 字节内存 + Y 字节内存。

如果是这样，您认为在代码存储容量有限的情况下生成的代码量是否值得关注？

问题2：

在上面的示例中，如果您创建了第二个std::array< int, 10 >实例，对函数的调用是否也会复制生成代码中的函数调用？即使两个实例属于同一类型，int?

score 6 · Accepted Answer

std::array被认为是零成本抽象，这意味着编译器应该可以对其进行相当优化。

对于任何零成本抽象，它可能会导致小的编译时间损失，如果不支持真正零成本所需的优化，那么它可能会导致小规模或运行时损失。

但是，请注意编译器可以自由地在结构的末尾添加填充。由于std::array是一个结构，你应该检查你的平台是如何处理的std::array，但我非常怀疑你的情况。

拿这个数组和std::array案例：

#include <numeric>
#include <iterator>

template<std::size_t n>
int stuff(const int(&arr)[n]) {
    return std::accumulate(std::begin(arr), std::end(arr), 0);
}

int main() {
    int arr[] = {1, 2, 3, 4, 5, 6};
    return stuff(arr);
}

#include <numeric>
#include <iterator>
#include <array>

template<std::size_t n>
int stuff(const std::array<int, n>& arr) {
    return std::accumulate(std::begin(arr), std::end(arr), 0);
}

int main() {
    std::array arr = {1, 2, 3, 4, 5, 6};
    return stuff(arr);
}

Clang 非常支持这种情况。所有带有std::array或原始数组的情况都以相同的方式处理：

-O2/-O3数组和std::array铿锵声：

main: # @main
  mov eax, 21
  ret

std::array但是，对于原始数组情况，GCC 似乎在优化它时遇到了问题：

-O3使用 GCC 进行数组和std::array：

main:
  movdqa xmm0, XMMWORD PTR .LC0[rip]
  movaps XMMWORD PTR [rsp-40], xmm0
  mov edx, DWORD PTR [rsp-32]
  mov eax, DWORD PTR [rsp-28]
  lea eax, [rdx+14+rax]
  ret
.LC0:
  .long 1
  .long 2
  .long 3
  .long 4

-O2然后，在原始数组的情况下，它似乎可以更好地优化并失败std::array：

-O2海湾合作委员会std::array：

main:
  movabs rax, 8589934593
  lea rdx, [rsp-40]
  mov ecx, 1
  mov QWORD PTR [rsp-40], rax
  movabs rax, 17179869187
  mov QWORD PTR [rsp-32], rax
  movabs rax, 25769803781
  lea rsi, [rdx+24]
  mov QWORD PTR [rsp-24], rax
  xor eax, eax
  jmp .L3
.L5:
  mov ecx, DWORD PTR [rdx]
.L3:
  add rdx, 4
  add eax, ecx
  cmp rdx, rsi
  jne .L5
  rep ret

-O2GCC原始数组：

main:
  mov eax, 21
  ret

似乎 GCC 错误未能优化-O3但成功-O2在最新版本中已修复。

这是一个编译器资源管理器，其中包含O2所有O3

std::array说明所有这些情况后，您可以看到一个常见模式：二进制文件中没有输出任何有关的信息。没有构造函数，没有operator[]，甚至没有迭代器，也没有算法。一切都是内联的。编译器擅长内联简单的函数。std::array成员函数通常非常非常简单。

如果您创建 std::array< SomeObject, 5 > 的另一个实例，然后调用该 std::array 的函数，那么这些函数中的每一个现在是否会在二进制文件中复制，从而占用更多闪存？X 字节内存 + Y 字节内存。

好吧，您更改了数组包含的数据类型。如果您手动添加所有函数的重载来处理这种额外的情况，那么是的，所有这些新函数可能会占用一些空间。如果你的函数很小，它们很有可能被内联并占用更少的空间。正如您在上面的示例中看到的那样，内联和常量折叠可能会大大减少您的二进制大小。

在上面的示例中，如果您创建了第二个 std::array 实例，对函数的调用是否也会复制闪存中的函数调用？即使两个实例属于同一类型，int?

再次取决于。如果您有许多以数组大小为模板的函数，则std::array原始数组和原始数组都可能“创建”不同的函数。但同样，如果它们是内联的，则无需担心重复。

两者都是原始数组std::array，您可以传递指向数组开头的指针并传递大小。如果您发现这更适合您的情况，请使用它，但仍然是原始数组并且std::array可以做到这一点。对于原始数组，它隐式衰减为指针，并且std::array您必须使用arr.data()来获取指针。

c++ - std::array 模板实例会占用更多的代码内存吗？

1 回答 1

Related

Reference