[Clang][AArch64][SVE2p3][SME2p3] Add intrinsics for v9.7a... (c6de992a) · Commits · llvm-doe / llvm-project

clang/include/clang/Basic/arm_sve.td

+13 −0

Original line number	Diff line number	Diff line
		@@ -1421,6 +1421,19 @@ defm SVMINP_S : SInstPairwise<"svminp", "csli", "aarch64_sve_sminp", [
		defm SVMINP_U : SInstPairwise<"svminp", "UcUsUiUl", "aarch64_sve_uminp", [VerifyRuntimeMode]>;
		}

		////////////////////////////////////////////////////////////////////////////////
		// SVE2.3 - Add pairwise within quadword vector segments

		let SVETargetGuard = "sve2p3\|sme2p3", SMETargetGuard = "sve2p3\|sme2p3" in {
		def SVADDQP : SInst<"svaddqp[_{d}]", "ddd", "csilUcUsUiUl", MergeNone, "aarch64_sve_addqp",
		[VerifyRuntimeMode]>;
		def SVADDSUBP : SInst<"svaddsubp[_{d}]", "ddd", "csilUcUsUiUl", MergeNone, "aarch64_sve_addsubp",
		[VerifyRuntimeMode]>;
		def SVSUBP_M : SInst<"svsubp[_{d}]", "dPdd", "csilUcUsUiUl", MergeOp1, "aarch64_sve_subp", [VerifyRuntimeMode]>;
		def SVSUBP_X : SInst<"svsubp[_{d}]", "dPdd", "csilUcUsUiUl", MergeAny, "aarch64_sve_subp", [VerifyRuntimeMode]>;
		def SVSUBP_Z : SInst<"svsubp[_{d}]", "dPdd", "csilUcUsUiUl", MergeZero, "aarch64_sve_subp", [VerifyRuntimeMode]>;
		}

		////////////////////////////////////////////////////////////////////////////////
		// SVE2 - Widening pairwise arithmetic

clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_addqp.c

0 → 100644

+265 −0

Original line number	Diff line number	Diff line
		// NOTE: Assertions have been autogenerated by utils/update_cc_test_checks.py UTC_ARGS: --version 6
		// RUN: %clang_cc1 -triple aarch64 -target-feature +sve -target-feature +sve2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
		// RUN: %clang_cc1 -triple aarch64 -target-feature +sve -target-feature +sve2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - -x c++ %s \| FileCheck %s -check-prefix=CPP-CHECK
		// RUN: %clang_cc1 -triple aarch64 -target-feature +sme -target-feature +sme2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
		// RUN: %clang_cc1 -triple aarch64 -target-feature +sve -target-feature +sme2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
		// RUN: %clang_cc1 -triple aarch64 -target-feature +sme -target-feature +sve2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
		// RUN: %clang_cc1 -DSVE_OVERLOADED_FORMS -triple aarch64 -target-feature +sve -target-feature +sve2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
		// RUN: %clang_cc1 -DSVE_OVERLOADED_FORMS -triple aarch64 -target-feature +sve -target-feature +sve2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - -x c++ %s \| FileCheck %s -check-prefix=CPP-CHECK
		// RUN: %clang_cc1 -DSVE_OVERLOADED_FORMS -triple aarch64 -target-feature +sme -target-feature +sme2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
		// RUN: %clang_cc1 -DSVE_OVERLOADED_FORMS -triple aarch64 -target-feature +sve -target-feature +sme2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - %s \| FileCheck %s
		// RUN: %clang_cc1 -DSVE_OVERLOADED_FORMS -triple aarch64 -target-feature +sme -target-feature +sve2p3 -disable-O0-optnone -Werror -Wall -emit-llvm -o - %s \| FileCheck %s

		// RUN: %clang_cc1 -triple aarch64 -target-feature +sve -target-feature +sve2p3 -S -disable-O0-optnone -Werror -Wall -o /dev/null %s
		// RUN: %clang_cc1 -triple aarch64 -target-feature +sme -target-feature +sme2p3 -S -disable-O0-optnone -Werror -Wall -o /dev/null %s

		// REQUIRES: aarch64-registered-target

		#include <arm_sve.h>

		#if defined(__ARM_FEATURE_SME) && defined(__ARM_FEATURE_SVE)
		#define ATTR __arm_streaming_compatible
		#elif defined(__ARM_FEATURE_SME)
		#define ATTR __arm_streaming
		#else
		#define ATTR
		#endif

		#ifdef SVE_OVERLOADED_FORMS
		// A simple used,unused... macro, long enough to represent any SVE builtin.
		#define SVE_ACLE_FUNC(A1,A2_UNUSED) A1
		#else
		#define SVE_ACLE_FUNC(A1,A2) A1##A2
		#endif

		// CHECK-LABEL: define dso_local <vscale x 16 x i8> @test_svaddqp_s8(
		// CHECK-SAME: <vscale x 16 x i8> [[ZN:%.]], <vscale x 16 x i8> [[ZM:%.]]) #[[ATTR0:[0-9]+]] {
		// CHECK-NEXT: [[ENTRY:.*:]]
		// CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 16 x i8>, align 16
		// CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 16 x i8>, align 16
		// CHECK-NEXT: store <vscale x 16 x i8> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: store <vscale x 16 x i8> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 16 x i8>, ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 16 x i8>, ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 16 x i8> @llvm.aarch64.sve.addqp.nxv16i8(<vscale x 16 x i8> [[TMP0]], <vscale x 16 x i8> [[TMP1]])
		// CHECK-NEXT: ret <vscale x 16 x i8> [[TMP2]]
		//
		// CPP-CHECK-LABEL: define dso_local <vscale x 16 x i8> @_Z15test_svaddqp_s8u10__SVInt8_tS_(
		// CPP-CHECK-SAME: <vscale x 16 x i8> [[ZN:%.]], <vscale x 16 x i8> [[ZM:%.]]) #[[ATTR0:[0-9]+]] {
		// CPP-CHECK-NEXT: [[ENTRY:.*:]]
		// CPP-CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 16 x i8>, align 16
		// CPP-CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 16 x i8>, align 16
		// CPP-CHECK-NEXT: store <vscale x 16 x i8> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: store <vscale x 16 x i8> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 16 x i8>, ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 16 x i8>, ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 16 x i8> @llvm.aarch64.sve.addqp.nxv16i8(<vscale x 16 x i8> [[TMP0]], <vscale x 16 x i8> [[TMP1]])
		// CPP-CHECK-NEXT: ret <vscale x 16 x i8> [[TMP2]]
		//
		svint8_t test_svaddqp_s8(svint8_t zn, svint8_t zm) ATTR
		{
		return SVE_ACLE_FUNC(svaddqp,_s8)(zn, zm);
		}

		// CHECK-LABEL: define dso_local <vscale x 16 x i8> @test_svaddqp_u8(
		// CHECK-SAME: <vscale x 16 x i8> [[ZN:%.]], <vscale x 16 x i8> [[ZM:%.]]) #[[ATTR0]] {
		// CHECK-NEXT: [[ENTRY:.*:]]
		// CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 16 x i8>, align 16
		// CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 16 x i8>, align 16
		// CHECK-NEXT: store <vscale x 16 x i8> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: store <vscale x 16 x i8> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 16 x i8>, ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 16 x i8>, ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 16 x i8> @llvm.aarch64.sve.addqp.nxv16i8(<vscale x 16 x i8> [[TMP0]], <vscale x 16 x i8> [[TMP1]])
		// CHECK-NEXT: ret <vscale x 16 x i8> [[TMP2]]
		//
		// CPP-CHECK-LABEL: define dso_local <vscale x 16 x i8> @_Z15test_svaddqp_u8u11__SVUint8_tS_(
		// CPP-CHECK-SAME: <vscale x 16 x i8> [[ZN:%.]], <vscale x 16 x i8> [[ZM:%.]]) #[[ATTR0]] {
		// CPP-CHECK-NEXT: [[ENTRY:.*:]]
		// CPP-CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 16 x i8>, align 16
		// CPP-CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 16 x i8>, align 16
		// CPP-CHECK-NEXT: store <vscale x 16 x i8> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: store <vscale x 16 x i8> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 16 x i8>, ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 16 x i8>, ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 16 x i8> @llvm.aarch64.sve.addqp.nxv16i8(<vscale x 16 x i8> [[TMP0]], <vscale x 16 x i8> [[TMP1]])
		// CPP-CHECK-NEXT: ret <vscale x 16 x i8> [[TMP2]]
		//
		svuint8_t test_svaddqp_u8(svuint8_t zn, svuint8_t zm) ATTR
		{
		return SVE_ACLE_FUNC(svaddqp,_u8)(zn, zm);
		}

		// CHECK-LABEL: define dso_local <vscale x 8 x i16> @test_svaddqp_s16(
		// CHECK-SAME: <vscale x 8 x i16> [[ZN:%.]], <vscale x 8 x i16> [[ZM:%.]]) #[[ATTR0]] {
		// CHECK-NEXT: [[ENTRY:.*:]]
		// CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 8 x i16>, align 16
		// CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 8 x i16>, align 16
		// CHECK-NEXT: store <vscale x 8 x i16> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: store <vscale x 8 x i16> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 8 x i16>, ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 8 x i16>, ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 8 x i16> @llvm.aarch64.sve.addqp.nxv8i16(<vscale x 8 x i16> [[TMP0]], <vscale x 8 x i16> [[TMP1]])
		// CHECK-NEXT: ret <vscale x 8 x i16> [[TMP2]]
		//
		// CPP-CHECK-LABEL: define dso_local <vscale x 8 x i16> @_Z16test_svaddqp_s16u11__SVInt16_tS_(
		// CPP-CHECK-SAME: <vscale x 8 x i16> [[ZN:%.]], <vscale x 8 x i16> [[ZM:%.]]) #[[ATTR0]] {
		// CPP-CHECK-NEXT: [[ENTRY:.*:]]
		// CPP-CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 8 x i16>, align 16
		// CPP-CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 8 x i16>, align 16
		// CPP-CHECK-NEXT: store <vscale x 8 x i16> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: store <vscale x 8 x i16> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 8 x i16>, ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 8 x i16>, ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 8 x i16> @llvm.aarch64.sve.addqp.nxv8i16(<vscale x 8 x i16> [[TMP0]], <vscale x 8 x i16> [[TMP1]])
		// CPP-CHECK-NEXT: ret <vscale x 8 x i16> [[TMP2]]
		//
		svint16_t test_svaddqp_s16(svint16_t zn, svint16_t zm)ATTR
		{
		return SVE_ACLE_FUNC(svaddqp,_s16)(zn, zm);
		}

		// CHECK-LABEL: define dso_local <vscale x 8 x i16> @test_svaddqp_u16(
		// CHECK-SAME: <vscale x 8 x i16> [[ZN:%.]], <vscale x 8 x i16> [[ZM:%.]]) #[[ATTR0]] {
		// CHECK-NEXT: [[ENTRY:.*:]]
		// CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 8 x i16>, align 16
		// CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 8 x i16>, align 16
		// CHECK-NEXT: store <vscale x 8 x i16> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: store <vscale x 8 x i16> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 8 x i16>, ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 8 x i16>, ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 8 x i16> @llvm.aarch64.sve.addqp.nxv8i16(<vscale x 8 x i16> [[TMP0]], <vscale x 8 x i16> [[TMP1]])
		// CHECK-NEXT: ret <vscale x 8 x i16> [[TMP2]]
		//
		// CPP-CHECK-LABEL: define dso_local <vscale x 8 x i16> @_Z16test_svaddqp_u16u12__SVUint16_tS_(
		// CPP-CHECK-SAME: <vscale x 8 x i16> [[ZN:%.]], <vscale x 8 x i16> [[ZM:%.]]) #[[ATTR0]] {
		// CPP-CHECK-NEXT: [[ENTRY:.*:]]
		// CPP-CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 8 x i16>, align 16
		// CPP-CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 8 x i16>, align 16
		// CPP-CHECK-NEXT: store <vscale x 8 x i16> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: store <vscale x 8 x i16> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 8 x i16>, ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 8 x i16>, ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 8 x i16> @llvm.aarch64.sve.addqp.nxv8i16(<vscale x 8 x i16> [[TMP0]], <vscale x 8 x i16> [[TMP1]])
		// CPP-CHECK-NEXT: ret <vscale x 8 x i16> [[TMP2]]
		//
		svuint16_t test_svaddqp_u16(svuint16_t zn, svuint16_t zm) ATTR
		{
		return SVE_ACLE_FUNC(svaddqp,_u16)(zn, zm);
		}

		// CHECK-LABEL: define dso_local <vscale x 4 x i32> @test_svaddqp_s32(
		// CHECK-SAME: <vscale x 4 x i32> [[ZN:%.]], <vscale x 4 x i32> [[ZM:%.]]) #[[ATTR0]] {
		// CHECK-NEXT: [[ENTRY:.*:]]
		// CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 4 x i32>, align 16
		// CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 4 x i32>, align 16
		// CHECK-NEXT: store <vscale x 4 x i32> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: store <vscale x 4 x i32> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 4 x i32>, ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 4 x i32>, ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 4 x i32> @llvm.aarch64.sve.addqp.nxv4i32(<vscale x 4 x i32> [[TMP0]], <vscale x 4 x i32> [[TMP1]])
		// CHECK-NEXT: ret <vscale x 4 x i32> [[TMP2]]
		//
		// CPP-CHECK-LABEL: define dso_local <vscale x 4 x i32> @_Z16test_svaddqp_s32u11__SVInt32_tS_(
		// CPP-CHECK-SAME: <vscale x 4 x i32> [[ZN:%.]], <vscale x 4 x i32> [[ZM:%.]]) #[[ATTR0]] {
		// CPP-CHECK-NEXT: [[ENTRY:.*:]]
		// CPP-CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 4 x i32>, align 16
		// CPP-CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 4 x i32>, align 16
		// CPP-CHECK-NEXT: store <vscale x 4 x i32> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: store <vscale x 4 x i32> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 4 x i32>, ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 4 x i32>, ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 4 x i32> @llvm.aarch64.sve.addqp.nxv4i32(<vscale x 4 x i32> [[TMP0]], <vscale x 4 x i32> [[TMP1]])
		// CPP-CHECK-NEXT: ret <vscale x 4 x i32> [[TMP2]]
		//
		svint32_t test_svaddqp_s32(svint32_t zn, svint32_t zm) ATTR
		{
		return SVE_ACLE_FUNC(svaddqp,_s32)(zn, zm);
		}

		// CHECK-LABEL: define dso_local <vscale x 4 x i32> @test_svaddqp_u32(
		// CHECK-SAME: <vscale x 4 x i32> [[ZN:%.]], <vscale x 4 x i32> [[ZM:%.]]) #[[ATTR0]] {
		// CHECK-NEXT: [[ENTRY:.*:]]
		// CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 4 x i32>, align 16
		// CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 4 x i32>, align 16
		// CHECK-NEXT: store <vscale x 4 x i32> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: store <vscale x 4 x i32> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 4 x i32>, ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 4 x i32>, ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 4 x i32> @llvm.aarch64.sve.addqp.nxv4i32(<vscale x 4 x i32> [[TMP0]], <vscale x 4 x i32> [[TMP1]])
		// CHECK-NEXT: ret <vscale x 4 x i32> [[TMP2]]
		//
		// CPP-CHECK-LABEL: define dso_local <vscale x 4 x i32> @_Z16test_svaddqp_u32u12__SVUint32_tS_(
		// CPP-CHECK-SAME: <vscale x 4 x i32> [[ZN:%.]], <vscale x 4 x i32> [[ZM:%.]]) #[[ATTR0]] {
		// CPP-CHECK-NEXT: [[ENTRY:.*:]]
		// CPP-CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 4 x i32>, align 16
		// CPP-CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 4 x i32>, align 16
		// CPP-CHECK-NEXT: store <vscale x 4 x i32> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: store <vscale x 4 x i32> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 4 x i32>, ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 4 x i32>, ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 4 x i32> @llvm.aarch64.sve.addqp.nxv4i32(<vscale x 4 x i32> [[TMP0]], <vscale x 4 x i32> [[TMP1]])
		// CPP-CHECK-NEXT: ret <vscale x 4 x i32> [[TMP2]]
		//
		svuint32_t test_svaddqp_u32(svuint32_t zn, svuint32_t zm) ATTR
		{
		return SVE_ACLE_FUNC(svaddqp,_u32)(zn, zm);
		}

		// CHECK-LABEL: define dso_local <vscale x 2 x i64> @test_svaddqp_s64(
		// CHECK-SAME: <vscale x 2 x i64> [[ZN:%.]], <vscale x 2 x i64> [[ZM:%.]]) #[[ATTR0]] {
		// CHECK-NEXT: [[ENTRY:.*:]]
		// CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 2 x i64>, align 16
		// CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 2 x i64>, align 16
		// CHECK-NEXT: store <vscale x 2 x i64> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: store <vscale x 2 x i64> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 2 x i64>, ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 2 x i64>, ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 2 x i64> @llvm.aarch64.sve.addqp.nxv2i64(<vscale x 2 x i64> [[TMP0]], <vscale x 2 x i64> [[TMP1]])
		// CHECK-NEXT: ret <vscale x 2 x i64> [[TMP2]]
		//
		// CPP-CHECK-LABEL: define dso_local <vscale x 2 x i64> @_Z16test_svaddqp_s64u11__SVInt64_tS_(
		// CPP-CHECK-SAME: <vscale x 2 x i64> [[ZN:%.]], <vscale x 2 x i64> [[ZM:%.]]) #[[ATTR0]] {
		// CPP-CHECK-NEXT: [[ENTRY:.*:]]
		// CPP-CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 2 x i64>, align 16
		// CPP-CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 2 x i64>, align 16
		// CPP-CHECK-NEXT: store <vscale x 2 x i64> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: store <vscale x 2 x i64> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 2 x i64>, ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 2 x i64>, ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 2 x i64> @llvm.aarch64.sve.addqp.nxv2i64(<vscale x 2 x i64> [[TMP0]], <vscale x 2 x i64> [[TMP1]])
		// CPP-CHECK-NEXT: ret <vscale x 2 x i64> [[TMP2]]
		//
		svint64_t test_svaddqp_s64(svint64_t zn, svint64_t zm) ATTR
		{
		return SVE_ACLE_FUNC(svaddqp,_s64)(zn, zm);
		}

		// CHECK-LABEL: define dso_local <vscale x 2 x i64> @test_svaddqp_u64(
		// CHECK-SAME: <vscale x 2 x i64> [[ZN:%.]], <vscale x 2 x i64> [[ZM:%.]]) #[[ATTR0]] {
		// CHECK-NEXT: [[ENTRY:.*:]]
		// CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 2 x i64>, align 16
		// CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 2 x i64>, align 16
		// CHECK-NEXT: store <vscale x 2 x i64> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: store <vscale x 2 x i64> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 2 x i64>, ptr [[ZN_ADDR]], align 16
		// CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 2 x i64>, ptr [[ZM_ADDR]], align 16
		// CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 2 x i64> @llvm.aarch64.sve.addqp.nxv2i64(<vscale x 2 x i64> [[TMP0]], <vscale x 2 x i64> [[TMP1]])
		// CHECK-NEXT: ret <vscale x 2 x i64> [[TMP2]]
		//
		// CPP-CHECK-LABEL: define dso_local <vscale x 2 x i64> @_Z16test_svaddqp_u64u12__SVUint64_tS_(
		// CPP-CHECK-SAME: <vscale x 2 x i64> [[ZN:%.]], <vscale x 2 x i64> [[ZM:%.]]) #[[ATTR0]] {
		// CPP-CHECK-NEXT: [[ENTRY:.*:]]
		// CPP-CHECK-NEXT: [[ZN_ADDR:%.*]] = alloca <vscale x 2 x i64>, align 16
		// CPP-CHECK-NEXT: [[ZM_ADDR:%.*]] = alloca <vscale x 2 x i64>, align 16
		// CPP-CHECK-NEXT: store <vscale x 2 x i64> [[ZN]], ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: store <vscale x 2 x i64> [[ZM]], ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP0:%.*]] = load <vscale x 2 x i64>, ptr [[ZN_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP1:%.*]] = load <vscale x 2 x i64>, ptr [[ZM_ADDR]], align 16
		// CPP-CHECK-NEXT: [[TMP2:%.*]] = call <vscale x 2 x i64> @llvm.aarch64.sve.addqp.nxv2i64(<vscale x 2 x i64> [[TMP0]], <vscale x 2 x i64> [[TMP1]])
		// CPP-CHECK-NEXT: ret <vscale x 2 x i64> [[TMP2]]
		//
		svuint64_t test_svaddqp_u64(svuint64_t zn, svuint64_t zm) ATTR
		{
		return SVE_ACLE_FUNC(svaddqp,_u64)(zn, zm);
		}

clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_addsubp.c

0 → 100644

+265 −0

File added.

Preview size limit exceeded, changes collapsed.

clang/test/CodeGen/AArch64/sve2p3-intrinsics/acle_sve2p3_subp.c

0 → 100644

+928 −0

File added.

Preview size limit exceeded, changes collapsed.

clang/test/Sema/AArch64/arm_sve_feature_dependent_sve_AND_LP_sve2p3_OR_sme2p3_RP___sme_AND_LP_sve2p3_OR_sme2p3_RP.c

0 → 100644

+241 −0

File added.

Preview size limit exceeded, changes collapsed.