3

我正在尝试使HADDPS指令起作用,但似乎无法__256在此代码中声明。

#include <xmmintrin.h>
#include <emmintrin.h>
#include <pmmintrin.h>
#include <stdio.h>
#include <stdint.h>
#include <iostream>

__m256 HADDPS(__m256 __X, __m256 __Y)
{
    return _mm256_hadd_ps (__X, __Y);
}
int main()
{
    //horizontal add packed single-------------------------------------------------
    __m256 HADDPSA = _mm_set_ps(4.0f, 3.0f, 2.0f, 1.0f);
    __m256 HADDPSB = _mm_set_ps(4.0f, 3.0f, 2.0f, 1.0f);
    __m256 HADDPSR = HADDPS(HADDPSA, HADDPSB);

    return 0;
}

我将 g++ 与-msse -msse2 -msse3 -msse4.

这是错误。

HADDPS.cpp|8|error: '__m256' does not name a type|
HADDPS.cpp||In function 'int main()':|
HADDPS.cpp|15|error: '__m256' was not declared in this scope|
HADDPS.cpp|15|error: expected ';' before 'HADDPSA'|
HADDPS.cpp|16|error: expected ';' before 'HADDPSB'|
HADDPS.cpp|17|error: expected ';' before 'HADDPSR'|
4

2 回答 2

2

从您拥有的多个内含物开始,您在这里几乎没有混乱。

首先,您的代码不是干净的 C 代码,也不是干净的 C++,它的混合只会让您头疼,因为您没有从中获得任何好处。

如果你真的想用 C++ 编写代码,你应该添加一些extern "C"并删除所C headers涉及的内容,如果你更喜欢 CI 建议删除它#include <iostream>并使用gcc而不是g++.

您还同时包含多个 SSE 集的标题,请参阅这篇文章以获得更简洁的方法。

最后,这是一个程序的源代码,它试图模仿您可能正在寻找的业务逻辑

#include <pmmintrin.h>
#include <immintrin.h>

__m128 HADDPS(__m128 __X, __m128 __Y)
{
  return _mm_hadd_ps (__X, __Y);
}

int main()
{
  __m128 HADDPSA = _mm_set_ps(4.0f, 3.0f, 2.0f, 1.0f);
  __m128 HADDPSB = _mm_set_ps(4.0f, 3.0f, 2.0f, 1.0f);
  __m128 HADDPSR = HADDPS(HADDPSA, HADDPSB);

  return 0;
}

你应该编译这个

gcc -msse3 main.c
于 2013-07-07T02:14:36.463 回答
1

这是一个使用原始问题的 __m256 数据类型的示例。使用 gcc 或 g++ 4.8.1 或 VS2012 编译没有错误。

// gcc compile command line: gcc -mavx sample.c
// g++ compile command line: g++ -mavx sample.c
// VS2012 compile command line: cl sample.c

#include <intrin.h>

__m256 HADDPS(__m256 __X, __m256 __Y)
{
    return _mm256_hadd_ps (__X, __Y);
}
int main()
{
    //horizontal add packed single-------------------------------------------------
    __m256 HADDPSA = _mm256_set_ps(4.0f, 3.0f, 2.0f, 1.0f, 4.0f, 3.0f, 2.0f, 1.0f);
    __m256 HADDPSB = _mm256_set_ps(4.0f, 3.0f, 2.0f, 1.0f, 4.0f, 3.0f, 2.0f, 1.0f);
    __m256 HADDPSR = HADDPS(HADDPSA, HADDPSB);

    return 0;
}
于 2013-07-07T16:14:57.507 回答