问题标签 [compiler-optimization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - java编译器优化
Java 编译器是否足够聪明,可以优化下面的循环,通过提取
退出for循环?
c++ - Visual C++.NET,速度优化
我希望尽可能快地执行我的 VC++ 代码。有人知道我应该在项目属性和设置中更改或设置什么吗?
c# - Visual Studio 构建中“优化代码”选项的好处
我们的大部分 C# 发布代码都是在关闭“优化代码”选项的情况下构建的。我相信这是为了让在 Release 模式下构建的代码更容易调试。
鉴于我们正在创建连接到后端 Web 服务的相当简单的桌面软件(即不是一个特别占用处理器的应用程序),那么如果可能会出现任何类型的性能损失怎么办?
是否有任何特定平台可能受到更严重的影响?例如。多处理器/64 位。
c++ - C++ 在 VS 中定义了“更好”的发布模式构建
我目前使用以下预处理器定义和各种优化设置:
- WIN32_LEAN_AND_MEAN
- VC_EXTRALEAN
- 标称最大值
- _CRT_SECURE_NO_WARNINGS
- _SCL_SECURE_NO_WARNINGS
- _SECURE_SCL=0
- _HAS_ITERATOR_DEBUGGING=0
我的问题是其他 SOers 还使用、添加、定义了哪些其他东西,以便从 VS C++(2008,2010)获得尽可能高性能的发布模式构建?
顺便说一句,我尝试过 PGO 等,它确实有一点帮助,但没有什么能与 GCC 相提并论,而且我没有使用流,我说的 C++ 更像 C,但使用模板和 STL 算法等等
就目前而言,与 GCC 在运行 linux(2.6+ 内核)的等效 x86 机器上使用 02 生成的相比,非常简单的代码段在性能方面显得苍白无力。
旁注:我相信很多问题都与 MS 提供的 STL 版本(Dinkum)直接相关。人们能否详细说明在 VS C++ 中使用 STLPort 等的经验。
multicore - 一些理解 GCC 源代码的指针
我是一名正在为多核处理器优化 GCC 的学生。我尝试浏览源代码,但很难通过它,因为我需要在后端添加一些代码。谁能建议一些好的资源来解释不同阶段的代码流。也建议一些调试GCC的开发环境,主要是单步调试代码。在windows上可以吗?
language-features - 语言和虚拟机:难以优化的功能及其原因
我正在为一个研究项目做准备。
说出一种难以优化的主流语言或语言特性,以及为什么该特性值得或不值得付出的代价,或者只是用轶事证据来揭穿我的理论。在有人将此标记为主观之前,我要求提供语言或功能的具体示例,以及优化这些功能的想法,或者我没有考虑过的重要功能。此外,任何对证明我的理论正确或错误的实现的引用。
在我的难以优化的特性和我的理论列表中名列前茅(我的一些理论未经测试,基于思想实验):
1)运行时方法重载(又名多方法分派或基于签名的分派)。与允许运行时重新编译或方法添加的功能结合使用时是否难以优化。还是只是很难,无论如何?调用站点缓存是许多运行时系统的常见优化,但多方法增加了额外的复杂性,并且使得内联方法不太实用。
2)类型变形/变体(也就是基于值的类型,而不是基于变量的类型)当您不知道某些类型是否可以在基本块中更改时,根本无法应用传统的优化。结合多方法,内联必须小心地完成,并且可能只针对给定的被调用者大小阈值。IE。很容易考虑内联简单的属性获取(getter / setter),但内联复杂的方法可能会导致代码膨胀。另一个问题是我不能只将变量分配给寄存器并将其 JIT 到本机指令,因为我必须携带类型信息,或者每个变量都需要 2 个寄存器而不是 1 个。在 IA-32 上这很不方便,即使使用 x64 的额外寄存器进行了改进。这可能是我最喜欢的动态语言特性,因为它从程序员的角度简化了很多事情。
3)头等舱延续- 有多种实现它们的方法,我在两种最常见的方法中都这样做了,一种是堆栈复制,另一种是实现运行时以使用连续传递样式、仙人掌堆栈、写时复制堆栈帧,和垃圾收集。一流的延续有资源管理问题,即。我们必须保存所有内容,以防继续继续,而且我不知道是否有任何语言支持留下“意图”的延续(即“我不会回到这里,所以你可以丢弃这个世界的副本” )。在线程模型和延续模型中编程后,我知道两者都可以完成同样的事情,但延续' 优雅给运行时带来了相当大的复杂性,并且还可能影响缓存效率(堆栈的位置随着使用延续和协同程序而改变更多)。另一个问题是它们只是不映射到硬件。优化延续就是针对不太常见的情况进行优化,正如我们所知,常见的情况应该很快,而不太常见的情况应该是正确的。
4)指针算术和屏蔽指针的能力(以整数存储等)必须把它扔进去,但实际上我可以很容易地没有它。
我的感觉是,许多高级特性,尤其是动态语言中的特性,并没有映射到硬件. 微处理器实现在芯片优化背后进行了数十亿美元的研究,但语言特性的选择可能会边缘化其中许多特性(如缓存、堆栈顶部到寄存器的别名、指令并行性、返回地址缓冲区、循环缓冲区和分支预测)。微特征的宏应用不一定像一些开发人员想的那样成功,在 VM 中实现多种语言最终会将本机操作映射到函数调用中(即,语言越动态,我们必须查找的次数越多/在运行时缓存,什么都不能假设,所以我们的指令组合比传统的由更高比例的非本地分支组成,静态编译的代码),我们唯一能真正做到 JIT 的就是对非动态类型的表达式求值以及对常量或立即类型的操作。我的直觉是字节码虚拟机和 JIT 内核可能并不总是因此而适用于某些语言。
我欢迎你的回答。
java - 链接构造函数时,JVM 的隐式内存屏障如何表现?
参考我之前关于未完全构造的对象的问题,我还有第二个问题。正如 Jon Skeet 指出的那样,构造函数末尾有一个隐式内存屏障,可确保final
所有线程都可以看到字段。但是如果一个构造函数调用另一个构造函数呢?他们每个人的末尾是否有这样的内存屏障,或者仅在首先被调用的那个末尾?也就是说,当“错误”的解决方案是:
正确的是工厂方法版本:
以下是否也有效?
更新:基本问题是this()
保证实际调用上面的私有构造函数(在这种情况下,预期的地方会有障碍,一切都是安全的),或者私有构造函数是否有可能作为一个内联到公共构造函数中优化以保存一个内存屏障(在这种情况下,直到公共构造函数结束时才会有屏障)?
规则是否在this()
某处精确定义?如果不是,那么我认为我们必须假设允许内联链式构造函数,并且可能一些 JVM 甚至可能javac
正在这样做。
c++ - 有没有办法让 MSVC 在 x64 上的寄存器中传递结构参数?
对于带有签名的函数:
在 x64 上编译,我希望Pair
通过寄存器传递的字段,就好像函数是:
在 OSX 10.6 上使用 gcc 4.2.1 为 x86_64 编译测试,我可以通过检查反汇编看到这正是发生的情况。但是,在 Windows 上使用 MSVC 2008 for x64 编译时,反汇编显示它Pair
在堆栈上传递。我了解平台 ABI 可以阻止这种优化;有没有人知道任何 MSVC 特定的注释、调用约定、标志或其他可以使它工作的黑客?
谢谢!
c++ - “volatile”限定符和编译器重新排序
编译器无法消除或重新排序对volatile
-qualified 变量的读/写。
但是在其他变量存在的情况下,可能是也可能不是- 限定的volatile
呢?
方案 1
编译器可以重新排序第一个和第二个,或者第三个和第四个赋值吗?
方案 2
同样的问题,编译器可以重新排序第一个和第二个,还是第三个和第四个赋值?
c++ - 编译器中的复制方法优化
我有以下代码:
它是这样使用的:
从 CopyStack 的声明中删除引用符号(返回副本而不是引用)在 Visual Studio 2008 中没有区别(关于调用复制的次数)。我猜它会被优化掉——通常它应该首先为返回值制作一个副本,然后再次调用赋值运算符将它分配给变量 sc。
您对不同编译器中的这种优化有何经验?
问候, 泽南