doxygen/NVPTXISelDAGToDAG_8cpp_source.html

//===-- NVPTXISelDAGToDAG.cpp - A dag to dag inst selector for NVPTX ------===//

//

// Part of the LLVM Project, under the Apache License v2.0 with LLVM Exceptions.

// See https://llvm.org/LICENSE.txt for license information.

// SPDX-License-Identifier: Apache-2.0 WITH LLVM-exception

//

//===----------------------------------------------------------------------===//

//

// This file defines an instruction selector for the NVPTX target.

//

//===----------------------------------------------------------------------===//


#include "NVPTXISelDAGToDAG.h"

#include "MCTargetDesc/NVPTXBaseInfo.h"

#include "NVPTXUtilities.h"

#include "llvm/Analysis/ValueTracking.h"

#include "llvm/CodeGen/ISDOpcodes.h"

#include "llvm/IR/GlobalValue.h"

#include "llvm/IR/Instructions.h"

#include "llvm/IR/IntrinsicsNVPTX.h"

#include "llvm/Support/AtomicOrdering.h"

#include "llvm/Support/CommandLine.h"

#include "llvm/Support/Debug.h"

#include "llvm/Support/ErrorHandling.h"

#include "llvm/Support/raw_ostream.h"

#include "llvm/Target/TargetIntrinsicInfo.h"


using namespace llvm;


#define DEBUG_TYPE "nvptx-isel"

#define PASS_NAME "NVPTX DAG->DAG Pattern Instruction Selection"


static cl::opt<bool>

    EnableRsqrtOpt("nvptx-rsqrt-approx-opt", cl::init(true), cl::Hidden,

                   cl::desc("Enable reciprocal sqrt optimization"));


/// createNVPTXISelDag - This pass converts a legalized DAG into a

/// NVPTX-specific DAG, ready for instruction scheduling.

FunctionPass *llvm::createNVPTXISelDag(NVPTXTargetMachine &TM,

                                       llvm::CodeGenOptLevel OptLevel) {

  return new NVPTXDAGToDAGISelLegacy(TM, OptLevel);

}


NVPTXDAGToDAGISelLegacy::NVPTXDAGToDAGISelLegacy(NVPTXTargetMachine &tm,

                                                 CodeGenOptLevel OptLevel)

    : SelectionDAGISelLegacy(

          ID, std::make_unique<NVPTXDAGToDAGISel>(tm, OptLevel)) {}


char NVPTXDAGToDAGISelLegacy::ID = 0;


INITIALIZE_PASS(NVPTXDAGToDAGISelLegacy, DEBUG_TYPE, PASS_NAME, false, false)


NVPTXDAGToDAGISel::NVPTXDAGToDAGISel(NVPTXTargetMachine &tm,

                                     CodeGenOptLevel OptLevel)

    : SelectionDAGISel(tm, OptLevel), TM(tm) {

  doMulWide = (OptLevel > CodeGenOptLevel::None);

}


bool NVPTXDAGToDAGISel::runOnMachineFunction(MachineFunction &MF) {

  Subtarget = &MF.getSubtarget<NVPTXSubtarget>();

  return SelectionDAGISel::runOnMachineFunction(MF);

}


int NVPTXDAGToDAGISel::getDivF32Level() const {

  return Subtarget->getTargetLowering()->getDivF32Level();

}


bool NVPTXDAGToDAGISel::usePrecSqrtF32() const {

  return Subtarget->getTargetLowering()->usePrecSqrtF32();

}


bool NVPTXDAGToDAGISel::useF32FTZ() const {

  return Subtarget->getTargetLowering()->useF32FTZ(*MF);

}


bool NVPTXDAGToDAGISel::allowFMA() const {

  const NVPTXTargetLowering *TL = Subtarget->getTargetLowering();

  return TL->allowFMA(*MF, OptLevel);

}


bool NVPTXDAGToDAGISel::allowUnsafeFPMath() const {

  const NVPTXTargetLowering *TL = Subtarget->getTargetLowering();

  return TL->allowUnsafeFPMath(*MF);

}


bool NVPTXDAGToDAGISel::doRsqrtOpt() const { return EnableRsqrtOpt; }


/// Select - Select instructions not customized! Used for

/// expanded, promoted and normal instructions.

void NVPTXDAGToDAGISel::Select(SDNode *N) {


  if (N->isMachineOpcode()) {

    N->setNodeId(-1);

    return; // Already selected.

  }


  switch (N->getOpcode()) {

  case ISD::LOAD:

  case ISD::ATOMIC_LOAD:

    if (tryLoad(N))

      return;

    break;

  case ISD::STORE:

  case ISD::ATOMIC_STORE:

    if (tryStore(N))

      return;

    break;

  case ISD::EXTRACT_VECTOR_ELT:

    if (tryEXTRACT_VECTOR_ELEMENT(N))

      return;

    break;

  case NVPTXISD::SETP_F16X2:

    SelectSETP_F16X2(N);

    return;

  case NVPTXISD::SETP_BF16X2:

    SelectSETP_BF16X2(N);

    return;

  case NVPTXISD::LoadV2:

  case NVPTXISD::LoadV4:

    if (tryLoadVector(N))

      return;

    break;

  case NVPTXISD::LDGV2:

  case NVPTXISD::LDGV4:

  case NVPTXISD::LDUV2:

  case NVPTXISD::LDUV4:

    if (tryLDGLDU(N))

      return;

    break;

  case NVPTXISD::StoreV2:

  case NVPTXISD::StoreV4:

    if (tryStoreVector(N))

      return;

    break;

  case NVPTXISD::LoadParam:

  case NVPTXISD::LoadParamV2:

  case NVPTXISD::LoadParamV4:

    if (tryLoadParam(N))

      return;

    break;

  case NVPTXISD::StoreRetval:

  case NVPTXISD::StoreRetvalV2:

  case NVPTXISD::StoreRetvalV4:

    if (tryStoreRetval(N))

      return;

    break;

  case NVPTXISD::StoreParam:

  case NVPTXISD::StoreParamV2:

  case NVPTXISD::StoreParamV4:

  case NVPTXISD::StoreParamS32:

  case NVPTXISD::StoreParamU32:

    if (tryStoreParam(N))

      return;

    break;

  case ISD::INTRINSIC_WO_CHAIN:

    if (tryIntrinsicNoChain(N))

      return;

    break;

  case ISD::INTRINSIC_W_CHAIN:

    if (tryIntrinsicChain(N))

      return;

    break;

  case NVPTXISD::Tex1DFloatS32:

  case NVPTXISD::Tex1DFloatFloat:

  case NVPTXISD::Tex1DFloatFloatLevel:

  case NVPTXISD::Tex1DFloatFloatGrad:

  case NVPTXISD::Tex1DS32S32:

  case NVPTXISD::Tex1DS32Float:

  case NVPTXISD::Tex1DS32FloatLevel:

  case NVPTXISD::Tex1DS32FloatGrad:

  case NVPTXISD::Tex1DU32S32:

  case NVPTXISD::Tex1DU32Float:

  case NVPTXISD::Tex1DU32FloatLevel:

  case NVPTXISD::Tex1DU32FloatGrad:

  case NVPTXISD::Tex1DArrayFloatS32:

  case NVPTXISD::Tex1DArrayFloatFloat:

  case NVPTXISD::Tex1DArrayFloatFloatLevel:

  case NVPTXISD::Tex1DArrayFloatFloatGrad:

  case NVPTXISD::Tex1DArrayS32S32:

  case NVPTXISD::Tex1DArrayS32Float:

  case NVPTXISD::Tex1DArrayS32FloatLevel:

  case NVPTXISD::Tex1DArrayS32FloatGrad:

  case NVPTXISD::Tex1DArrayU32S32:

  case NVPTXISD::Tex1DArrayU32Float:

  case NVPTXISD::Tex1DArrayU32FloatLevel:

  case NVPTXISD::Tex1DArrayU32FloatGrad:

  case NVPTXISD::Tex2DFloatS32:

  case NVPTXISD::Tex2DFloatFloat:

  case NVPTXISD::Tex2DFloatFloatLevel:

  case NVPTXISD::Tex2DFloatFloatGrad:

  case NVPTXISD::Tex2DS32S32:

  case NVPTXISD::Tex2DS32Float:

  case NVPTXISD::Tex2DS32FloatLevel:

  case NVPTXISD::Tex2DS32FloatGrad:

  case NVPTXISD::Tex2DU32S32:

  case NVPTXISD::Tex2DU32Float:

  case NVPTXISD::Tex2DU32FloatLevel:

  case NVPTXISD::Tex2DU32FloatGrad:

  case NVPTXISD::Tex2DArrayFloatS32:

  case NVPTXISD::Tex2DArrayFloatFloat:

  case NVPTXISD::Tex2DArrayFloatFloatLevel:

  case NVPTXISD::Tex2DArrayFloatFloatGrad:

  case NVPTXISD::Tex2DArrayS32S32:

  case NVPTXISD::Tex2DArrayS32Float:

  case NVPTXISD::Tex2DArrayS32FloatLevel:

  case NVPTXISD::Tex2DArrayS32FloatGrad:

  case NVPTXISD::Tex2DArrayU32S32:

  case NVPTXISD::Tex2DArrayU32Float:

  case NVPTXISD::Tex2DArrayU32FloatLevel:

  case NVPTXISD::Tex2DArrayU32FloatGrad:

  case NVPTXISD::Tex3DFloatS32:

  case NVPTXISD::Tex3DFloatFloat:

  case NVPTXISD::Tex3DFloatFloatLevel:

  case NVPTXISD::Tex3DFloatFloatGrad:

  case NVPTXISD::Tex3DS32S32:

  case NVPTXISD::Tex3DS32Float:

  case NVPTXISD::Tex3DS32FloatLevel:

  case NVPTXISD::Tex3DS32FloatGrad:

  case NVPTXISD::Tex3DU32S32:

  case NVPTXISD::Tex3DU32Float:

  case NVPTXISD::Tex3DU32FloatLevel:

  case NVPTXISD::Tex3DU32FloatGrad:

  case NVPTXISD::TexCubeFloatFloat:

  case NVPTXISD::TexCubeFloatFloatLevel:

  case NVPTXISD::TexCubeS32Float:

  case NVPTXISD::TexCubeS32FloatLevel:

  case NVPTXISD::TexCubeU32Float:

  case NVPTXISD::TexCubeU32FloatLevel:

  case NVPTXISD::TexCubeArrayFloatFloat:

  case NVPTXISD::TexCubeArrayFloatFloatLevel:

  case NVPTXISD::TexCubeArrayS32Float:

  case NVPTXISD::TexCubeArrayS32FloatLevel:

  case NVPTXISD::TexCubeArrayU32Float:

  case NVPTXISD::TexCubeArrayU32FloatLevel:

  case NVPTXISD::Tld4R2DFloatFloat:

  case NVPTXISD::Tld4G2DFloatFloat:

  case NVPTXISD::Tld4B2DFloatFloat:

  case NVPTXISD::Tld4A2DFloatFloat:

  case NVPTXISD::Tld4R2DS64Float:

  case NVPTXISD::Tld4G2DS64Float:

  case NVPTXISD::Tld4B2DS64Float:

  case NVPTXISD::Tld4A2DS64Float:

  case NVPTXISD::Tld4R2DU64Float:

  case NVPTXISD::Tld4G2DU64Float:

  case NVPTXISD::Tld4B2DU64Float:

  case NVPTXISD::Tld4A2DU64Float:

  case NVPTXISD::TexUnified1DFloatS32:

  case NVPTXISD::TexUnified1DFloatFloat:

  case NVPTXISD::TexUnified1DFloatFloatLevel:

  case NVPTXISD::TexUnified1DFloatFloatGrad:

  case NVPTXISD::TexUnified1DS32S32:

  case NVPTXISD::TexUnified1DS32Float:

  case NVPTXISD::TexUnified1DS32FloatLevel:

  case NVPTXISD::TexUnified1DS32FloatGrad:

  case NVPTXISD::TexUnified1DU32S32:

  case NVPTXISD::TexUnified1DU32Float:

  case NVPTXISD::TexUnified1DU32FloatLevel:

  case NVPTXISD::TexUnified1DU32FloatGrad:

  case NVPTXISD::TexUnified1DArrayFloatS32:

  case NVPTXISD::TexUnified1DArrayFloatFloat:

  case NVPTXISD::TexUnified1DArrayFloatFloatLevel:

  case NVPTXISD::TexUnified1DArrayFloatFloatGrad:

  case NVPTXISD::TexUnified1DArrayS32S32:

  case NVPTXISD::TexUnified1DArrayS32Float:

  case NVPTXISD::TexUnified1DArrayS32FloatLevel:

  case NVPTXISD::TexUnified1DArrayS32FloatGrad:

  case NVPTXISD::TexUnified1DArrayU32S32:

  case NVPTXISD::TexUnified1DArrayU32Float:

  case NVPTXISD::TexUnified1DArrayU32FloatLevel:

  case NVPTXISD::TexUnified1DArrayU32FloatGrad:

  case NVPTXISD::TexUnified2DFloatS32:

  case NVPTXISD::TexUnified2DFloatFloat:

  case NVPTXISD::TexUnified2DFloatFloatLevel:

  case NVPTXISD::TexUnified2DFloatFloatGrad:

  case NVPTXISD::TexUnified2DS32S32:

  case NVPTXISD::TexUnified2DS32Float:

  case NVPTXISD::TexUnified2DS32FloatLevel:

  case NVPTXISD::TexUnified2DS32FloatGrad:

  case NVPTXISD::TexUnified2DU32S32:

  case NVPTXISD::TexUnified2DU32Float:

  case NVPTXISD::TexUnified2DU32FloatLevel:

  case NVPTXISD::TexUnified2DU32FloatGrad:

  case NVPTXISD::TexUnified2DArrayFloatS32:

  case NVPTXISD::TexUnified2DArrayFloatFloat:

  case NVPTXISD::TexUnified2DArrayFloatFloatLevel:

  case NVPTXISD::TexUnified2DArrayFloatFloatGrad:

  case NVPTXISD::TexUnified2DArrayS32S32:

  case NVPTXISD::TexUnified2DArrayS32Float:

  case NVPTXISD::TexUnified2DArrayS32FloatLevel:

  case NVPTXISD::TexUnified2DArrayS32FloatGrad:

  case NVPTXISD::TexUnified2DArrayU32S32:

  case NVPTXISD::TexUnified2DArrayU32Float:

  case NVPTXISD::TexUnified2DArrayU32FloatLevel:

  case NVPTXISD::TexUnified2DArrayU32FloatGrad:

  case NVPTXISD::TexUnified3DFloatS32:

  case NVPTXISD::TexUnified3DFloatFloat:

  case NVPTXISD::TexUnified3DFloatFloatLevel:

  case NVPTXISD::TexUnified3DFloatFloatGrad:

  case NVPTXISD::TexUnified3DS32S32:

  case NVPTXISD::TexUnified3DS32Float:

  case NVPTXISD::TexUnified3DS32FloatLevel:

  case NVPTXISD::TexUnified3DS32FloatGrad:

  case NVPTXISD::TexUnified3DU32S32:

  case NVPTXISD::TexUnified3DU32Float:

  case NVPTXISD::TexUnified3DU32FloatLevel:

  case NVPTXISD::TexUnified3DU32FloatGrad:

  case NVPTXISD::TexUnifiedCubeFloatFloat:

  case NVPTXISD::TexUnifiedCubeFloatFloatLevel:

  case NVPTXISD::TexUnifiedCubeS32Float:

  case NVPTXISD::TexUnifiedCubeS32FloatLevel:

  case NVPTXISD::TexUnifiedCubeU32Float:

  case NVPTXISD::TexUnifiedCubeU32FloatLevel:

  case NVPTXISD::TexUnifiedCubeArrayFloatFloat:

  case NVPTXISD::TexUnifiedCubeArrayFloatFloatLevel:

  case NVPTXISD::TexUnifiedCubeArrayS32Float:

  case NVPTXISD::TexUnifiedCubeArrayS32FloatLevel:

  case NVPTXISD::TexUnifiedCubeArrayU32Float:

  case NVPTXISD::TexUnifiedCubeArrayU32FloatLevel:

  case NVPTXISD::TexUnifiedCubeFloatFloatGrad:

  case NVPTXISD::TexUnifiedCubeS32FloatGrad:

  case NVPTXISD::TexUnifiedCubeU32FloatGrad:

  case NVPTXISD::TexUnifiedCubeArrayFloatFloatGrad:

  case NVPTXISD::TexUnifiedCubeArrayS32FloatGrad:

  case NVPTXISD::TexUnifiedCubeArrayU32FloatGrad:

  case NVPTXISD::Tld4UnifiedR2DFloatFloat:

  case NVPTXISD::Tld4UnifiedG2DFloatFloat:

  case NVPTXISD::Tld4UnifiedB2DFloatFloat:

  case NVPTXISD::Tld4UnifiedA2DFloatFloat:

  case NVPTXISD::Tld4UnifiedR2DS64Float:

  case NVPTXISD::Tld4UnifiedG2DS64Float:

  case NVPTXISD::Tld4UnifiedB2DS64Float:

  case NVPTXISD::Tld4UnifiedA2DS64Float:

  case NVPTXISD::Tld4UnifiedR2DU64Float:

  case NVPTXISD::Tld4UnifiedG2DU64Float:

  case NVPTXISD::Tld4UnifiedB2DU64Float:

  case NVPTXISD::Tld4UnifiedA2DU64Float:

    if (tryTextureIntrinsic(N))

      return;

    break;

  case NVPTXISD::Suld1DI8Clamp:

  case NVPTXISD::Suld1DI16Clamp:

  case NVPTXISD::Suld1DI32Clamp:

  case NVPTXISD::Suld1DI64Clamp:

  case NVPTXISD::Suld1DV2I8Clamp:

  case NVPTXISD::Suld1DV2I16Clamp:

  case NVPTXISD::Suld1DV2I32Clamp:

  case NVPTXISD::Suld1DV2I64Clamp:

  case NVPTXISD::Suld1DV4I8Clamp:

  case NVPTXISD::Suld1DV4I16Clamp:

  case NVPTXISD::Suld1DV4I32Clamp:

  case NVPTXISD::Suld1DArrayI8Clamp:

  case NVPTXISD::Suld1DArrayI16Clamp:

  case NVPTXISD::Suld1DArrayI32Clamp:

  case NVPTXISD::Suld1DArrayI64Clamp:

  case NVPTXISD::Suld1DArrayV2I8Clamp:

  case NVPTXISD::Suld1DArrayV2I16Clamp:

  case NVPTXISD::Suld1DArrayV2I32Clamp:

  case NVPTXISD::Suld1DArrayV2I64Clamp:

  case NVPTXISD::Suld1DArrayV4I8Clamp:

  case NVPTXISD::Suld1DArrayV4I16Clamp:

  case NVPTXISD::Suld1DArrayV4I32Clamp:

  case NVPTXISD::Suld2DI8Clamp:

  case NVPTXISD::Suld2DI16Clamp:

  case NVPTXISD::Suld2DI32Clamp:

  case NVPTXISD::Suld2DI64Clamp:

  case NVPTXISD::Suld2DV2I8Clamp:

  case NVPTXISD::Suld2DV2I16Clamp:

  case NVPTXISD::Suld2DV2I32Clamp:

  case NVPTXISD::Suld2DV2I64Clamp:

  case NVPTXISD::Suld2DV4I8Clamp:

  case NVPTXISD::Suld2DV4I16Clamp:

  case NVPTXISD::Suld2DV4I32Clamp:

  case NVPTXISD::Suld2DArrayI8Clamp:

  case NVPTXISD::Suld2DArrayI16Clamp:

  case NVPTXISD::Suld2DArrayI32Clamp:

  case NVPTXISD::Suld2DArrayI64Clamp:

  case NVPTXISD::Suld2DArrayV2I8Clamp:

  case NVPTXISD::Suld2DArrayV2I16Clamp:

  case NVPTXISD::Suld2DArrayV2I32Clamp:

  case NVPTXISD::Suld2DArrayV2I64Clamp:

  case NVPTXISD::Suld2DArrayV4I8Clamp:

  case NVPTXISD::Suld2DArrayV4I16Clamp:

  case NVPTXISD::Suld2DArrayV4I32Clamp:

  case NVPTXISD::Suld3DI8Clamp:

  case NVPTXISD::Suld3DI16Clamp:

  case NVPTXISD::Suld3DI32Clamp:

  case NVPTXISD::Suld3DI64Clamp:

  case NVPTXISD::Suld3DV2I8Clamp:

  case NVPTXISD::Suld3DV2I16Clamp:

  case NVPTXISD::Suld3DV2I32Clamp:

  case NVPTXISD::Suld3DV2I64Clamp:

  case NVPTXISD::Suld3DV4I8Clamp:

  case NVPTXISD::Suld3DV4I16Clamp:

  case NVPTXISD::Suld3DV4I32Clamp:

  case NVPTXISD::Suld1DI8Trap:

  case NVPTXISD::Suld1DI16Trap:

  case NVPTXISD::Suld1DI32Trap:

  case NVPTXISD::Suld1DI64Trap:

  case NVPTXISD::Suld1DV2I8Trap:

  case NVPTXISD::Suld1DV2I16Trap:

  case NVPTXISD::Suld1DV2I32Trap:

  case NVPTXISD::Suld1DV2I64Trap:

  case NVPTXISD::Suld1DV4I8Trap:

  case NVPTXISD::Suld1DV4I16Trap:

  case NVPTXISD::Suld1DV4I32Trap:

  case NVPTXISD::Suld1DArrayI8Trap:

  case NVPTXISD::Suld1DArrayI16Trap:

  case NVPTXISD::Suld1DArrayI32Trap:

  case NVPTXISD::Suld1DArrayI64Trap:

  case NVPTXISD::Suld1DArrayV2I8Trap:

  case NVPTXISD::Suld1DArrayV2I16Trap:

  case NVPTXISD::Suld1DArrayV2I32Trap:

  case NVPTXISD::Suld1DArrayV2I64Trap:

  case NVPTXISD::Suld1DArrayV4I8Trap:

  case NVPTXISD::Suld1DArrayV4I16Trap:

  case NVPTXISD::Suld1DArrayV4I32Trap:

  case NVPTXISD::Suld2DI8Trap:

  case NVPTXISD::Suld2DI16Trap:

  case NVPTXISD::Suld2DI32Trap:

  case NVPTXISD::Suld2DI64Trap:

  case NVPTXISD::Suld2DV2I8Trap:

  case NVPTXISD::Suld2DV2I16Trap:

  case NVPTXISD::Suld2DV2I32Trap:

  case NVPTXISD::Suld2DV2I64Trap:

  case NVPTXISD::Suld2DV4I8Trap:

  case NVPTXISD::Suld2DV4I16Trap:

  case NVPTXISD::Suld2DV4I32Trap:

  case NVPTXISD::Suld2DArrayI8Trap:

  case NVPTXISD::Suld2DArrayI16Trap:

  case NVPTXISD::Suld2DArrayI32Trap:

  case NVPTXISD::Suld2DArrayI64Trap:

  case NVPTXISD::Suld2DArrayV2I8Trap:

  case NVPTXISD::Suld2DArrayV2I16Trap:

  case NVPTXISD::Suld2DArrayV2I32Trap:

  case NVPTXISD::Suld2DArrayV2I64Trap:

  case NVPTXISD::Suld2DArrayV4I8Trap:

  case NVPTXISD::Suld2DArrayV4I16Trap:

  case NVPTXISD::Suld2DArrayV4I32Trap:

  case NVPTXISD::Suld3DI8Trap:

  case NVPTXISD::Suld3DI16Trap:

  case NVPTXISD::Suld3DI32Trap:

  case NVPTXISD::Suld3DI64Trap:

  case NVPTXISD::Suld3DV2I8Trap:

  case NVPTXISD::Suld3DV2I16Trap:

  case NVPTXISD::Suld3DV2I32Trap:

  case NVPTXISD::Suld3DV2I64Trap:

  case NVPTXISD::Suld3DV4I8Trap:

  case NVPTXISD::Suld3DV4I16Trap:

  case NVPTXISD::Suld3DV4I32Trap:

  case NVPTXISD::Suld1DI8Zero:

  case NVPTXISD::Suld1DI16Zero:

  case NVPTXISD::Suld1DI32Zero:

  case NVPTXISD::Suld1DI64Zero:

  case NVPTXISD::Suld1DV2I8Zero:

  case NVPTXISD::Suld1DV2I16Zero:

  case NVPTXISD::Suld1DV2I32Zero:

  case NVPTXISD::Suld1DV2I64Zero:

  case NVPTXISD::Suld1DV4I8Zero:

  case NVPTXISD::Suld1DV4I16Zero:

  case NVPTXISD::Suld1DV4I32Zero:

  case NVPTXISD::Suld1DArrayI8Zero:

  case NVPTXISD::Suld1DArrayI16Zero:

  case NVPTXISD::Suld1DArrayI32Zero:

  case NVPTXISD::Suld1DArrayI64Zero:

  case NVPTXISD::Suld1DArrayV2I8Zero:

  case NVPTXISD::Suld1DArrayV2I16Zero:

  case NVPTXISD::Suld1DArrayV2I32Zero:

  case NVPTXISD::Suld1DArrayV2I64Zero:

  case NVPTXISD::Suld1DArrayV4I8Zero:

  case NVPTXISD::Suld1DArrayV4I16Zero:

  case NVPTXISD::Suld1DArrayV4I32Zero:

  case NVPTXISD::Suld2DI8Zero:

  case NVPTXISD::Suld2DI16Zero:

  case NVPTXISD::Suld2DI32Zero:

  case NVPTXISD::Suld2DI64Zero:

  case NVPTXISD::Suld2DV2I8Zero:

  case NVPTXISD::Suld2DV2I16Zero:

  case NVPTXISD::Suld2DV2I32Zero:

  case NVPTXISD::Suld2DV2I64Zero:

  case NVPTXISD::Suld2DV4I8Zero:

  case NVPTXISD::Suld2DV4I16Zero:

  case NVPTXISD::Suld2DV4I32Zero:

  case NVPTXISD::Suld2DArrayI8Zero:

  case NVPTXISD::Suld2DArrayI16Zero:

  case NVPTXISD::Suld2DArrayI32Zero:

  case NVPTXISD::Suld2DArrayI64Zero:

  case NVPTXISD::Suld2DArrayV2I8Zero:

  case NVPTXISD::Suld2DArrayV2I16Zero:

  case NVPTXISD::Suld2DArrayV2I32Zero:

  case NVPTXISD::Suld2DArrayV2I64Zero:

  case NVPTXISD::Suld2DArrayV4I8Zero:

  case NVPTXISD::Suld2DArrayV4I16Zero:

  case NVPTXISD::Suld2DArrayV4I32Zero:

  case NVPTXISD::Suld3DI8Zero:

  case NVPTXISD::Suld3DI16Zero:

  case NVPTXISD::Suld3DI32Zero:

  case NVPTXISD::Suld3DI64Zero:

  case NVPTXISD::Suld3DV2I8Zero:

  case NVPTXISD::Suld3DV2I16Zero:

  case NVPTXISD::Suld3DV2I32Zero:

  case NVPTXISD::Suld3DV2I64Zero:

  case NVPTXISD::Suld3DV4I8Zero:

  case NVPTXISD::Suld3DV4I16Zero:

  case NVPTXISD::Suld3DV4I32Zero:

    if (trySurfaceIntrinsic(N))

      return;

    break;

  case ISD::AND:

  case ISD::SRA:

  case ISD::SRL:

    // Try to select BFE

    if (tryBFE(N))

      return;

    break;

  case ISD::ADDRSPACECAST:

    SelectAddrSpaceCast(N);

    return;

  case ISD::ConstantFP:

    if (tryConstantFP(N))

      return;

    break;

  default:

    break;

  }

  SelectCode(N);

}


bool NVPTXDAGToDAGISel::tryIntrinsicChain(SDNode *N) {

  unsigned IID = N->getConstantOperandVal(1);

  switch (IID) {

  default:

    return false;

  case Intrinsic::nvvm_ldg_global_f:

  case Intrinsic::nvvm_ldg_global_i:

  case Intrinsic::nvvm_ldg_global_p:

  case Intrinsic::nvvm_ldu_global_f:

  case Intrinsic::nvvm_ldu_global_i:

  case Intrinsic::nvvm_ldu_global_p:

    return tryLDGLDU(N);

  }

}


// There's no way to specify FP16 and BF16 immediates in .(b)f16 ops, so we

// have to load them into an .(b)f16 register first.

bool NVPTXDAGToDAGISel::tryConstantFP(SDNode *N) {

  if (N->getValueType(0) != MVT::f16 && N->getValueType(0) != MVT::bf16)

    return false;

  SDValue Val = CurDAG->getTargetConstantFP(

      cast<ConstantFPSDNode>(N)->getValueAPF(), SDLoc(N), N->getValueType(0));

  SDNode *LoadConstF16 = CurDAG->getMachineNode(

      (N->getValueType(0) == MVT::f16 ? NVPTX::LOAD_CONST_F16

                                      : NVPTX::LOAD_CONST_BF16),

      SDLoc(N), N->getValueType(0), Val);

  ReplaceNode(N, LoadConstF16);

  return true;

}


// Map ISD:CONDCODE value to appropriate CmpMode expected by

// NVPTXInstPrinter::printCmpMode()

static unsigned getPTXCmpMode(const CondCodeSDNode &CondCode, bool FTZ) {

  using NVPTX::PTXCmpMode::CmpMode;

  unsigned PTXCmpMode = [](ISD::CondCode CC) {

    switch (CC) {

    default:

      llvm_unreachable("Unexpected condition code.");

    case ISD::SETOEQ:

      return CmpMode::EQ;

    case ISD::SETOGT:

      return CmpMode::GT;

    case ISD::SETOGE:

      return CmpMode::GE;

    case ISD::SETOLT:

      return CmpMode::LT;

    case ISD::SETOLE:

      return CmpMode::LE;

    case ISD::SETONE:

      return CmpMode::NE;

    case ISD::SETO:

      return CmpMode::NUM;

    case ISD::SETUO:

      return CmpMode::NotANumber;

    case ISD::SETUEQ:

      return CmpMode::EQU;

    case ISD::SETUGT:

      return CmpMode::GTU;

    case ISD::SETUGE:

      return CmpMode::GEU;

    case ISD::SETULT:

      return CmpMode::LTU;

    case ISD::SETULE:

      return CmpMode::LEU;

    case ISD::SETUNE:

      return CmpMode::NEU;

    case ISD::SETEQ:

      return CmpMode::EQ;

    case ISD::SETGT:

      return CmpMode::GT;

    case ISD::SETGE:

      return CmpMode::GE;

    case ISD::SETLT:

      return CmpMode::LT;

    case ISD::SETLE:

      return CmpMode::LE;

    case ISD::SETNE:

      return CmpMode::NE;

    }

  }(CondCode.get());


  if (FTZ)

    PTXCmpMode |= NVPTX::PTXCmpMode::FTZ_FLAG;


  return PTXCmpMode;

}


bool NVPTXDAGToDAGISel::SelectSETP_F16X2(SDNode *N) {

  unsigned PTXCmpMode =

      getPTXCmpMode(*cast<CondCodeSDNode>(N->getOperand(2)), useF32FTZ());

  SDLoc DL(N);

  SDNode *SetP = CurDAG->getMachineNode(

      NVPTX::SETP_f16x2rr, DL, MVT::i1, MVT::i1, N->getOperand(0),

      N->getOperand(1), CurDAG->getTargetConstant(PTXCmpMode, DL, MVT::i32));

  ReplaceNode(N, SetP);

  return true;

}


bool NVPTXDAGToDAGISel::SelectSETP_BF16X2(SDNode *N) {

  unsigned PTXCmpMode =

      getPTXCmpMode(*cast<CondCodeSDNode>(N->getOperand(2)), useF32FTZ());

  SDLoc DL(N);

  SDNode *SetP = CurDAG->getMachineNode(

      NVPTX::SETP_bf16x2rr, DL, MVT::i1, MVT::i1, N->getOperand(0),

      N->getOperand(1), CurDAG->getTargetConstant(PTXCmpMode, DL, MVT::i32));

  ReplaceNode(N, SetP);

  return true;

}


// Find all instances of extract_vector_elt that use this v2f16 vector

// and coalesce them into a scattering move instruction.

bool NVPTXDAGToDAGISel::tryEXTRACT_VECTOR_ELEMENT(SDNode *N) {

  SDValue Vector = N->getOperand(0);


  // We only care about 16x2 as it's the only real vector type we

  // need to deal with.

  MVT VT = Vector.getSimpleValueType();

  if (!Isv2x16VT(VT))

    return false;

  // Find and record all uses of this vector that extract element 0 or 1.

  SmallVector<SDNode *, 4> E0, E1;

  for (auto *U : Vector.getNode()->uses()) {

    if (U->getOpcode() != ISD::EXTRACT_VECTOR_ELT)

      continue;

    if (U->getOperand(0) != Vector)

      continue;

    if (const ConstantSDNode *IdxConst =

            dyn_cast<ConstantSDNode>(U->getOperand(1))) {

      if (IdxConst->getZExtValue() == 0)

        E0.push_back(U);

      else if (IdxConst->getZExtValue() == 1)

        E1.push_back(U);

      else

        llvm_unreachable("Invalid vector index.");

    }

  }


  // There's no point scattering f16x2 if we only ever access one

  // element of it.

  if (E0.empty() || E1.empty())

    return false;


  // Merge (f16 extractelt(V, 0), f16 extractelt(V,1))

  // into f16,f16 SplitF16x2(V)

  MVT EltVT = VT.getVectorElementType();

  SDNode *ScatterOp =

      CurDAG->getMachineNode(NVPTX::I32toV2I16, SDLoc(N), EltVT, EltVT, Vector);

  for (auto *Node : E0)

    ReplaceUses(SDValue(Node, 0), SDValue(ScatterOp, 0));

  for (auto *Node : E1)

    ReplaceUses(SDValue(Node, 0), SDValue(ScatterOp, 1));


  return true;

}


static unsigned int getCodeAddrSpace(MemSDNode *N) {

  const Value *Src = N->getMemOperand()->getValue();


  if (!Src)

    return NVPTX::PTXLdStInstCode::GENERIC;


  if (auto *PT = dyn_cast<PointerType>(Src->getType())) {

    switch (PT->getAddressSpace()) {

    case llvm::ADDRESS_SPACE_LOCAL: return NVPTX::PTXLdStInstCode::LOCAL;

    case llvm::ADDRESS_SPACE_GLOBAL: return NVPTX::PTXLdStInstCode::GLOBAL;

    case llvm::ADDRESS_SPACE_SHARED: return NVPTX::PTXLdStInstCode::SHARED;

    case llvm::ADDRESS_SPACE_GENERIC: return NVPTX::PTXLdStInstCode::GENERIC;

    case llvm::ADDRESS_SPACE_PARAM: return NVPTX::PTXLdStInstCode::PARAM;

    case llvm::ADDRESS_SPACE_CONST: return NVPTX::PTXLdStInstCode::CONSTANT;

    default: break;

    }

  }

  return NVPTX::PTXLdStInstCode::GENERIC;

}


static bool canLowerToLDG(MemSDNode *N, const NVPTXSubtarget &Subtarget,

                          unsigned CodeAddrSpace, MachineFunction *F) {

  // We use ldg (i.e. ld.global.nc) for invariant loads from the global address

  // space.

  //

  // We have two ways of identifying invariant loads: Loads may be explicitly

  // marked as invariant, or we may infer them to be invariant.

  //

  // We currently infer invariance for loads from

  //  - constant global variables, and

  //  - kernel function pointer params that are noalias (i.e. __restrict) and

  //    never written to.

  //

  // TODO: Perform a more powerful invariance analysis (ideally IPO, and ideally

  // not during the SelectionDAG phase).

  //

  // TODO: Infer invariance only at -O2.  We still want to use ldg at -O0 for

  // explicitly invariant loads because these are how clang tells us to use ldg

  // when the user uses a builtin.

  if (!Subtarget.hasLDG() || CodeAddrSpace != NVPTX::PTXLdStInstCode::GLOBAL)

    return false;


  if (N->isInvariant())

    return true;


  bool IsKernelFn = isKernelFunction(F->getFunction());


  // We use getUnderlyingObjects() here instead of getUnderlyingObject() mainly

  // because the former looks through phi nodes while the latter does not. We

  // need to look through phi nodes to handle pointer induction variables.

  SmallVector<const Value *, 8> Objs;

  getUnderlyingObjects(N->getMemOperand()->getValue(), Objs);


  return all_of(Objs, [&](const Value *V) {

    if (auto *A = dyn_cast<const Argument>(V))

      return IsKernelFn && A->onlyReadsMemory() && A->hasNoAliasAttr();

    if (auto *GV = dyn_cast<const GlobalVariable>(V))

      return GV->isConstant();

    return false;

  });

}


bool NVPTXDAGToDAGISel::tryIntrinsicNoChain(SDNode *N) {

  unsigned IID = N->getConstantOperandVal(0);

  switch (IID) {

  default:

    return false;

  case Intrinsic::nvvm_texsurf_handle_internal:

    SelectTexSurfHandle(N);

    return true;

  }

}


void NVPTXDAGToDAGISel::SelectTexSurfHandle(SDNode *N) {

  // Op 0 is the intrinsic ID

  SDValue Wrapper = N->getOperand(1);

  SDValue GlobalVal = Wrapper.getOperand(0);

  ReplaceNode(N, CurDAG->getMachineNode(NVPTX::texsurf_handles, SDLoc(N),

                                        MVT::i64, GlobalVal));

}


void NVPTXDAGToDAGISel::SelectAddrSpaceCast(SDNode *N) {

  SDValue Src = N->getOperand(0);

  AddrSpaceCastSDNode *CastN = cast<AddrSpaceCastSDNode>(N);

  unsigned SrcAddrSpace = CastN->getSrcAddressSpace();

  unsigned DstAddrSpace = CastN->getDestAddressSpace();

  assert(SrcAddrSpace != DstAddrSpace &&

         "addrspacecast must be between different address spaces");


  if (DstAddrSpace == ADDRESS_SPACE_GENERIC) {

    // Specific to generic

    unsigned Opc;

    switch (SrcAddrSpace) {

    default: report_fatal_error("Bad address space in addrspacecast");

    case ADDRESS_SPACE_GLOBAL:

      Opc = TM.is64Bit() ? NVPTX::cvta_global_64 : NVPTX::cvta_global;

      break;

    case ADDRESS_SPACE_SHARED:

      Opc = TM.is64Bit() ? (TM.getPointerSizeInBits(SrcAddrSpace) == 32

                                ? NVPTX::cvta_shared_6432

                                : NVPTX::cvta_shared_64)

                         : NVPTX::cvta_shared;

      break;

    case ADDRESS_SPACE_CONST:

      Opc = TM.is64Bit() ? (TM.getPointerSizeInBits(SrcAddrSpace) == 32

                                ? NVPTX::cvta_const_6432

                                : NVPTX::cvta_const_64)

                         : NVPTX::cvta_const;

      break;

    case ADDRESS_SPACE_LOCAL:

      Opc = TM.is64Bit() ? (TM.getPointerSizeInBits(SrcAddrSpace) == 32

                                ? NVPTX::cvta_local_6432

                                : NVPTX::cvta_local_64)

                         : NVPTX::cvta_local;

      break;

    }

    ReplaceNode(N, CurDAG->getMachineNode(Opc, SDLoc(N), N->getValueType(0),

                                          Src));

    return;

  } else {

    // Generic to specific

    if (SrcAddrSpace != 0)

      report_fatal_error("Cannot cast between two non-generic address spaces");

    unsigned Opc;

    switch (DstAddrSpace) {

    default: report_fatal_error("Bad address space in addrspacecast");

    case ADDRESS_SPACE_GLOBAL:

      Opc = TM.is64Bit() ? NVPTX::cvta_to_global_64 : NVPTX::cvta_to_global;

      break;

    case ADDRESS_SPACE_SHARED:

      Opc = TM.is64Bit() ? (TM.getPointerSizeInBits(DstAddrSpace) == 32

                                ? NVPTX::cvta_to_shared_3264

                                : NVPTX::cvta_to_shared_64)

                         : NVPTX::cvta_to_shared;

      break;

    case ADDRESS_SPACE_CONST:

      Opc = TM.is64Bit() ? (TM.getPointerSizeInBits(DstAddrSpace) == 32

                                ? NVPTX::cvta_to_const_3264

                                : NVPTX::cvta_to_const_64)

                         : NVPTX::cvta_to_const;

      break;

    case ADDRESS_SPACE_LOCAL:

      Opc = TM.is64Bit() ? (TM.getPointerSizeInBits(DstAddrSpace) == 32

                                ? NVPTX::cvta_to_local_3264

                                : NVPTX::cvta_to_local_64)

                         : NVPTX::cvta_to_local;

      break;

    case ADDRESS_SPACE_PARAM:

      Opc = TM.is64Bit() ? NVPTX::nvvm_ptr_gen_to_param_64

                         : NVPTX::nvvm_ptr_gen_to_param;

      break;

    }

    ReplaceNode(N, CurDAG->getMachineNode(Opc, SDLoc(N), N->getValueType(0),

                                          Src));

    return;

  }

}


// Helper function template to reduce amount of boilerplate code for

// opcode selection.

static std::optional<unsigned>

pickOpcodeForVT(MVT::SimpleValueType VT, unsigned Opcode_i8,

                unsigned Opcode_i16, unsigned Opcode_i32,

                std::optional<unsigned> Opcode_i64, unsigned Opcode_f32,

                std::optional<unsigned> Opcode_f64) {

  switch (VT) {

  case MVT::i1:

  case MVT::i8:

    return Opcode_i8;

  case MVT::i16:

    return Opcode_i16;

  case MVT::i32:

    return Opcode_i32;

  case MVT::i64:

    return Opcode_i64;

  case MVT::f16:

  case MVT::bf16:

    return Opcode_i16;

  case MVT::v2f16:

  case MVT::v2bf16:

  case MVT::v2i16:

  case MVT::v4i8:

    return Opcode_i32;

  case MVT::f32:

    return Opcode_f32;

  case MVT::f64:

    return Opcode_f64;

  default:

    return std::nullopt;

  }

}


static int getLdStRegType(EVT VT) {

  if (VT.isFloatingPoint())

    switch (VT.getSimpleVT().SimpleTy) {

    case MVT::f16:

    case MVT::bf16:

    case MVT::v2f16:

    case MVT::v2bf16:

      return NVPTX::PTXLdStInstCode::Untyped;

    default:

      return NVPTX::PTXLdStInstCode::Float;

    }

  else

    return NVPTX::PTXLdStInstCode::Unsigned;

}


bool NVPTXDAGToDAGISel::tryLoad(SDNode *N) {

  SDLoc dl(N);

  MemSDNode *LD = cast<MemSDNode>(N);

  assert(LD->readMem() && "Expected load");

  LoadSDNode *PlainLoad = dyn_cast<LoadSDNode>(N);

  EVT LoadedVT = LD->getMemoryVT();

  SDNode *NVPTXLD = nullptr;


  // do not support pre/post inc/dec

  if (PlainLoad && PlainLoad->isIndexed())

    return false;


  if (!LoadedVT.isSimple())

    return false;


  AtomicOrdering Ordering = LD->getSuccessOrdering();

  // In order to lower atomic loads with stronger guarantees we would need to

  // use load.acquire or insert fences. However these features were only added

  // with PTX ISA 6.0 / sm_70.

  // TODO: Check if we can actually use the new instructions and implement them.

  if (isStrongerThanMonotonic(Ordering))

    return false;


  // Address Space Setting

  unsigned int CodeAddrSpace = getCodeAddrSpace(LD);

  if (canLowerToLDG(LD, *Subtarget, CodeAddrSpace, MF)) {

    return tryLDGLDU(N);

  }


  unsigned int PointerSize =

      CurDAG->getDataLayout().getPointerSizeInBits(LD->getAddressSpace());


  // Volatile Setting

  // - .volatile is only available for .global and .shared

  // - .volatile has the same memory synchronization semantics as .relaxed.sys

  bool isVolatile = LD->isVolatile() || Ordering == AtomicOrdering::Monotonic;

  if (CodeAddrSpace != NVPTX::PTXLdStInstCode::GLOBAL &&

      CodeAddrSpace != NVPTX::PTXLdStInstCode::SHARED &&

      CodeAddrSpace != NVPTX::PTXLdStInstCode::GENERIC)

    isVolatile = false;


  // Type Setting: fromType + fromTypeWidth

  //

  // Sign   : ISD::SEXTLOAD

  // Unsign : ISD::ZEXTLOAD, ISD::NON_EXTLOAD or ISD::EXTLOAD and the

  //          type is integer

  // Float  : ISD::NON_EXTLOAD or ISD::EXTLOAD and the type is float

  MVT SimpleVT = LoadedVT.getSimpleVT();

  MVT ScalarVT = SimpleVT.getScalarType();

  // Read at least 8 bits (predicates are stored as 8-bit values)

  unsigned fromTypeWidth = std::max(8U, (unsigned)ScalarVT.getSizeInBits());

  unsigned int fromType;


  // Vector Setting

  unsigned vecType = NVPTX::PTXLdStInstCode::Scalar;

  if (SimpleVT.isVector()) {

    assert((Isv2x16VT(LoadedVT) || LoadedVT == MVT::v4i8) &&

           "Unexpected vector type");

    // v2f16/v2bf16/v2i16 is loaded using ld.b32

    fromTypeWidth = 32;

  }


  if (PlainLoad && (PlainLoad->getExtensionType() == ISD::SEXTLOAD))

    fromType = NVPTX::PTXLdStInstCode::Signed;

  else

    fromType = getLdStRegType(ScalarVT);


  // Create the machine instruction DAG

  SDValue Chain = N->getOperand(0);

  SDValue N1 = N->getOperand(1);

  SDValue Addr;

  SDValue Offset, Base;

  std::optional<unsigned> Opcode;

  MVT::SimpleValueType TargetVT = LD->getSimpleValueType(0).SimpleTy;


  if (SelectDirectAddr(N1, Addr)) {

    Opcode = pickOpcodeForVT(TargetVT, NVPTX::LD_i8_avar, NVPTX::LD_i16_avar,

                             NVPTX::LD_i32_avar, NVPTX::LD_i64_avar,

                             NVPTX::LD_f32_avar, NVPTX::LD_f64_avar);

    if (!Opcode)

      return false;

    SDValue Ops[] = { getI32Imm(isVolatile, dl), getI32Imm(CodeAddrSpace, dl),

                      getI32Imm(vecType, dl), getI32Imm(fromType, dl),

                      getI32Imm(fromTypeWidth, dl), Addr, Chain };

    NVPTXLD = CurDAG->getMachineNode(*Opcode, dl, TargetVT, MVT::Other, Ops);

  } else if (PointerSize == 64 ? SelectADDRsi64(N1.getNode(), N1, Base, Offset)

                               : SelectADDRsi(N1.getNode(), N1, Base, Offset)) {

    Opcode = pickOpcodeForVT(TargetVT, NVPTX::LD_i8_asi, NVPTX::LD_i16_asi,

                             NVPTX::LD_i32_asi, NVPTX::LD_i64_asi,

                             NVPTX::LD_f32_asi, NVPTX::LD_f64_asi);

    if (!Opcode)

      return false;

    SDValue Ops[] = { getI32Imm(isVolatile, dl), getI32Imm(CodeAddrSpace, dl),

                      getI32Imm(vecType, dl), getI32Imm(fromType, dl),

                      getI32Imm(fromTypeWidth, dl), Base, Offset, Chain };

    NVPTXLD = CurDAG->getMachineNode(*Opcode, dl, TargetVT, MVT::Other, Ops);

  } else if (PointerSize == 64 ? SelectADDRri64(N1.getNode(), N1, Base, Offset)

                               : SelectADDRri(N1.getNode(), N1, Base, Offset)) {

    if (PointerSize == 64)

      Opcode =

          pickOpcodeForVT(TargetVT, NVPTX::LD_i8_ari_64, NVPTX::LD_i16_ari_64,

                          NVPTX::LD_i32_ari_64, NVPTX::LD_i64_ari_64,

                          NVPTX::LD_f32_ari_64, NVPTX::LD_f64_ari_64);

    else

      Opcode = pickOpcodeForVT(TargetVT, NVPTX::LD_i8_ari, NVPTX::LD_i16_ari,

                               NVPTX::LD_i32_ari, NVPTX::LD_i64_ari,

                               NVPTX::LD_f32_ari, NVPTX::LD_f64_ari);

    if (!Opcode)

      return false;

    SDValue Ops[] = { getI32Imm(isVolatile, dl), getI32Imm(CodeAddrSpace, dl),

                      getI32Imm(vecType, dl), getI32Imm(fromType, dl),

                      getI32Imm(fromTypeWidth, dl), Base, Offset, Chain };

    NVPTXLD = CurDAG->getMachineNode(*Opcode, dl, TargetVT, MVT::Other, Ops);

  } else {

    if (PointerSize == 64)

      Opcode =

          pickOpcodeForVT(TargetVT, NVPTX::LD_i8_areg_64, NVPTX::LD_i16_areg_64,

                          NVPTX::LD_i32_areg_64, NVPTX::LD_i64_areg_64,

                          NVPTX::LD_f32_areg_64, NVPTX::LD_f64_areg_64);

    else

      Opcode = pickOpcodeForVT(TargetVT, NVPTX::LD_i8_areg, NVPTX::LD_i16_areg,

                               NVPTX::LD_i32_areg, NVPTX::LD_i64_areg,

                               NVPTX::LD_f32_areg, NVPTX::LD_f64_areg);

    if (!Opcode)

      return false;

    SDValue Ops[] = { getI32Imm(isVolatile, dl), getI32Imm(CodeAddrSpace, dl),

                      getI32Imm(vecType, dl), getI32Imm(fromType, dl),

                      getI32Imm(fromTypeWidth, dl), N1, Chain };

    NVPTXLD = CurDAG->getMachineNode(*Opcode, dl, TargetVT, MVT::Other, Ops);

  }


  if (!NVPTXLD)

    return false;


  MachineMemOperand *MemRef = cast<MemSDNode>(N)->getMemOperand();

  CurDAG->setNodeMemRefs(cast<MachineSDNode>(NVPTXLD), {MemRef});


  ReplaceNode(N, NVPTXLD);

  return true;

}


bool NVPTXDAGToDAGISel::tryLoadVector(SDNode *N) {


  SDValue Chain = N->getOperand(0);

  SDValue Op1 = N->getOperand(1);

  SDValue Addr, Offset, Base;

  std::optional<unsigned> Opcode;

  SDLoc DL(N);

  SDNode *LD;

  MemSDNode *MemSD = cast<MemSDNode>(N);

  EVT LoadedVT = MemSD->getMemoryVT();


  if (!LoadedVT.isSimple())

    return false;


  // Address Space Setting

  unsigned int CodeAddrSpace = getCodeAddrSpace(MemSD);

  if (canLowerToLDG(MemSD, *Subtarget, CodeAddrSpace, MF)) {

    return tryLDGLDU(N);

  }


  unsigned int PointerSize =

      CurDAG->getDataLayout().getPointerSizeInBits(MemSD->getAddressSpace());


  // Volatile Setting

  // - .volatile is only availalble for .global and .shared

  bool IsVolatile = MemSD->isVolatile();

  if (CodeAddrSpace != NVPTX::PTXLdStInstCode::GLOBAL &&

      CodeAddrSpace != NVPTX::PTXLdStInstCode::SHARED &&

      CodeAddrSpace != NVPTX::PTXLdStInstCode::GENERIC)

    IsVolatile = false;


  // Vector Setting

  MVT SimpleVT = LoadedVT.getSimpleVT();


  // Type Setting: fromType + fromTypeWidth

  //

  // Sign   : ISD::SEXTLOAD

  // Unsign : ISD::ZEXTLOAD, ISD::NON_EXTLOAD or ISD::EXTLOAD and the

  //          type is integer

  // Float  : ISD::NON_EXTLOAD or ISD::EXTLOAD and the type is float

  MVT ScalarVT = SimpleVT.getScalarType();

  // Read at least 8 bits (predicates are stored as 8-bit values)

  unsigned FromTypeWidth = std::max(8U, (unsigned)ScalarVT.getSizeInBits());

  unsigned int FromType;

  // The last operand holds the original LoadSDNode::getExtensionType() value

  unsigned ExtensionType = cast<ConstantSDNode>(

      N->getOperand(N->getNumOperands() - 1))->getZExtValue();

  if (ExtensionType == ISD::SEXTLOAD)

    FromType = NVPTX::PTXLdStInstCode::Signed;

  else

    FromType = getLdStRegType(ScalarVT);


  unsigned VecType;


  switch (N->getOpcode()) {

  case NVPTXISD::LoadV2:

    VecType = NVPTX::PTXLdStInstCode::V2;

    break;

  case NVPTXISD::LoadV4:

    VecType = NVPTX::PTXLdStInstCode::V4;

    break;

  default:

    return false;

  }


  EVT EltVT = N->getValueType(0);


  // v8x16 is a special case. PTX doesn't have ld.v8.16

  // instruction. Instead, we split the vector into v2x16 chunks and

  // load them with ld.v4.b32.

  if (Isv2x16VT(EltVT)) {

    assert(N->getOpcode() == NVPTXISD::LoadV4 && "Unexpected load opcode.");

    EltVT = MVT::i32;

    FromType = NVPTX::PTXLdStInstCode::Untyped;

    FromTypeWidth = 32;

  }


  if (SelectDirectAddr(Op1, Addr)) {

    switch (N->getOpcode()) {

    default:

      return false;

    case NVPTXISD::LoadV2:

      Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                               NVPTX::LDV_i8_v2_avar, NVPTX::LDV_i16_v2_avar,

                               NVPTX::LDV_i32_v2_avar, NVPTX::LDV_i64_v2_avar,

                               NVPTX::LDV_f32_v2_avar, NVPTX::LDV_f64_v2_avar);

      break;

    case NVPTXISD::LoadV4:

      Opcode =

          pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy, NVPTX::LDV_i8_v4_avar,

                          NVPTX::LDV_i16_v4_avar, NVPTX::LDV_i32_v4_avar,

                          std::nullopt, NVPTX::LDV_f32_v4_avar, std::nullopt);

      break;

    }

    if (!Opcode)

      return false;

    SDValue Ops[] = { getI32Imm(IsVolatile, DL), getI32Imm(CodeAddrSpace, DL),

                      getI32Imm(VecType, DL), getI32Imm(FromType, DL),

                      getI32Imm(FromTypeWidth, DL), Addr, Chain };

    LD = CurDAG->getMachineNode(*Opcode, DL, N->getVTList(), Ops);

  } else if (PointerSize == 64

                 ? SelectADDRsi64(Op1.getNode(), Op1, Base, Offset)

                 : SelectADDRsi(Op1.getNode(), Op1, Base, Offset)) {

    switch (N->getOpcode()) {

    default:

      return false;

    case NVPTXISD::LoadV2:

      Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                               NVPTX::LDV_i8_v2_asi, NVPTX::LDV_i16_v2_asi,

                               NVPTX::LDV_i32_v2_asi, NVPTX::LDV_i64_v2_asi,

                               NVPTX::LDV_f32_v2_asi, NVPTX::LDV_f64_v2_asi);

      break;

    case NVPTXISD::LoadV4:

      Opcode =

          pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy, NVPTX::LDV_i8_v4_asi,

                          NVPTX::LDV_i16_v4_asi, NVPTX::LDV_i32_v4_asi,

                          std::nullopt, NVPTX::LDV_f32_v4_asi, std::nullopt);

      break;

    }

    if (!Opcode)

      return false;

    SDValue Ops[] = { getI32Imm(IsVolatile, DL), getI32Imm(CodeAddrSpace, DL),

                      getI32Imm(VecType, DL), getI32Imm(FromType, DL),

                      getI32Imm(FromTypeWidth, DL), Base, Offset, Chain };

    LD = CurDAG->getMachineNode(*Opcode, DL, N->getVTList(), Ops);

  } else if (PointerSize == 64

                 ? SelectADDRri64(Op1.getNode(), Op1, Base, Offset)

                 : SelectADDRri(Op1.getNode(), Op1, Base, Offset)) {

    if (PointerSize == 64) {

      switch (N->getOpcode()) {

      default:

        return false;

      case NVPTXISD::LoadV2:

        Opcode =

            pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                            NVPTX::LDV_i8_v2_ari_64, NVPTX::LDV_i16_v2_ari_64,

                            NVPTX::LDV_i32_v2_ari_64, NVPTX::LDV_i64_v2_ari_64,

                            NVPTX::LDV_f32_v2_ari_64, NVPTX::LDV_f64_v2_ari_64);

        break;

      case NVPTXISD::LoadV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::LDV_i8_v4_ari_64,

            NVPTX::LDV_i16_v4_ari_64, NVPTX::LDV_i32_v4_ari_64, std::nullopt,

            NVPTX::LDV_f32_v4_ari_64, std::nullopt);

        break;

      }

    } else {

      switch (N->getOpcode()) {

      default:

        return false;

      case NVPTXISD::LoadV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::LDV_i8_v2_ari, NVPTX::LDV_i16_v2_ari,

                                 NVPTX::LDV_i32_v2_ari, NVPTX::LDV_i64_v2_ari,

                                 NVPTX::LDV_f32_v2_ari, NVPTX::LDV_f64_v2_ari);

        break;

      case NVPTXISD::LoadV4:

        Opcode =

            pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy, NVPTX::LDV_i8_v4_ari,

                            NVPTX::LDV_i16_v4_ari, NVPTX::LDV_i32_v4_ari,

                            std::nullopt, NVPTX::LDV_f32_v4_ari, std::nullopt);

        break;

      }

    }

    if (!Opcode)

      return false;

    SDValue Ops[] = { getI32Imm(IsVolatile, DL), getI32Imm(CodeAddrSpace, DL),

                      getI32Imm(VecType, DL), getI32Imm(FromType, DL),

                      getI32Imm(FromTypeWidth, DL), Base, Offset, Chain };


    LD = CurDAG->getMachineNode(*Opcode, DL, N->getVTList(), Ops);

  } else {

    if (PointerSize == 64) {

      switch (N->getOpcode()) {

      default:

        return false;

      case NVPTXISD::LoadV2:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::LDV_i8_v2_areg_64,

            NVPTX::LDV_i16_v2_areg_64, NVPTX::LDV_i32_v2_areg_64,

            NVPTX::LDV_i64_v2_areg_64, NVPTX::LDV_f32_v2_areg_64,

            NVPTX::LDV_f64_v2_areg_64);

        break;

      case NVPTXISD::LoadV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::LDV_i8_v4_areg_64,

            NVPTX::LDV_i16_v4_areg_64, NVPTX::LDV_i32_v4_areg_64, std::nullopt,

            NVPTX::LDV_f32_v4_areg_64, std::nullopt);

        break;

      }

    } else {

      switch (N->getOpcode()) {

      default:

        return false;

      case NVPTXISD::LoadV2:

        Opcode =

            pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy, NVPTX::LDV_i8_v2_areg,

                            NVPTX::LDV_i16_v2_areg, NVPTX::LDV_i32_v2_areg,

                            NVPTX::LDV_i64_v2_areg, NVPTX::LDV_f32_v2_areg,

                            NVPTX::LDV_f64_v2_areg);

        break;

      case NVPTXISD::LoadV4:

        Opcode =

            pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy, NVPTX::LDV_i8_v4_areg,

                            NVPTX::LDV_i16_v4_areg, NVPTX::LDV_i32_v4_areg,

                            std::nullopt, NVPTX::LDV_f32_v4_areg, std::nullopt);

        break;

      }

    }

    if (!Opcode)

      return false;

    SDValue Ops[] = { getI32Imm(IsVolatile, DL), getI32Imm(CodeAddrSpace, DL),

                      getI32Imm(VecType, DL), getI32Imm(FromType, DL),

                      getI32Imm(FromTypeWidth, DL), Op1, Chain };

    LD = CurDAG->getMachineNode(*Opcode, DL, N->getVTList(), Ops);

  }


  MachineMemOperand *MemRef = cast<MemSDNode>(N)->getMemOperand();

  CurDAG->setNodeMemRefs(cast<MachineSDNode>(LD), {MemRef});


  ReplaceNode(N, LD);

  return true;

}


bool NVPTXDAGToDAGISel::tryLDGLDU(SDNode *N) {


  SDValue Chain = N->getOperand(0);

  SDValue Op1;

  MemSDNode *Mem;

  bool IsLDG = true;


  // If this is an LDG intrinsic, the address is the third operand. If its an

  // LDG/LDU SD node (from custom vector handling), then its the second operand

  if (N->getOpcode() == ISD::INTRINSIC_W_CHAIN) {

    Op1 = N->getOperand(2);

    Mem = cast<MemIntrinsicSDNode>(N);

    unsigned IID = N->getConstantOperandVal(1);

    switch (IID) {

    default:

      return false;

    case Intrinsic::nvvm_ldg_global_f:

    case Intrinsic::nvvm_ldg_global_i:

    case Intrinsic::nvvm_ldg_global_p:

      IsLDG = true;

      break;

    case Intrinsic::nvvm_ldu_global_f:

    case Intrinsic::nvvm_ldu_global_i:

    case Intrinsic::nvvm_ldu_global_p:

      IsLDG = false;

      break;

    }

  } else {

    Op1 = N->getOperand(1);

    Mem = cast<MemSDNode>(N);

  }


  std::optional<unsigned> Opcode;

  SDLoc DL(N);

  SDNode *LD;

  SDValue Base, Offset, Addr;

  EVT OrigType = N->getValueType(0);


  EVT EltVT = Mem->getMemoryVT();

  unsigned NumElts = 1;

  if (EltVT.isVector()) {

    NumElts = EltVT.getVectorNumElements();

    EltVT = EltVT.getVectorElementType();

    // vectors of 16bits type are loaded/stored as multiples of v2x16 elements.

    if ((EltVT == MVT::f16 && OrigType == MVT::v2f16) ||

        (EltVT == MVT::bf16 && OrigType == MVT::v2bf16) ||

        (EltVT == MVT::i16 && OrigType == MVT::v2i16)) {

      assert(NumElts % 2 == 0 && "Vector must have even number of elements");

      EltVT = OrigType;

      NumElts /= 2;

    } else if (OrigType == MVT::v4i8) {

      EltVT = OrigType;

      NumElts = 1;

    }

  }


  // Build the "promoted" result VTList for the load. If we are really loading

  // i8s, then the return type will be promoted to i16 since we do not expose

  // 8-bit registers in NVPTX.

  EVT NodeVT = (EltVT == MVT::i8) ? MVT::i16 : EltVT;

  SmallVector<EVT, 5> InstVTs;

  for (unsigned i = 0; i != NumElts; ++i) {

    InstVTs.push_back(NodeVT);

  }

  InstVTs.push_back(MVT::Other);

  SDVTList InstVTList = CurDAG->getVTList(InstVTs);


  if (SelectDirectAddr(Op1, Addr)) {

    switch (N->getOpcode()) {

    default:

      return false;

    case ISD::LOAD:

    case ISD::INTRINSIC_W_CHAIN:

      if (IsLDG)

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::INT_PTX_LDG_GLOBAL_i8avar,

                                 NVPTX::INT_PTX_LDG_GLOBAL_i16avar,

                                 NVPTX::INT_PTX_LDG_GLOBAL_i32avar,

                                 NVPTX::INT_PTX_LDG_GLOBAL_i64avar,

                                 NVPTX::INT_PTX_LDG_GLOBAL_f32avar,

                                 NVPTX::INT_PTX_LDG_GLOBAL_f64avar);

      else

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::INT_PTX_LDU_GLOBAL_i8avar,

                                 NVPTX::INT_PTX_LDU_GLOBAL_i16avar,

                                 NVPTX::INT_PTX_LDU_GLOBAL_i32avar,

                                 NVPTX::INT_PTX_LDU_GLOBAL_i64avar,

                                 NVPTX::INT_PTX_LDU_GLOBAL_f32avar,

                                 NVPTX::INT_PTX_LDU_GLOBAL_f64avar);

      break;

    case NVPTXISD::LoadV2:

    case NVPTXISD::LDGV2:

      Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                               NVPTX::INT_PTX_LDG_G_v2i8_ELE_avar,

                               NVPTX::INT_PTX_LDG_G_v2i16_ELE_avar,

                               NVPTX::INT_PTX_LDG_G_v2i32_ELE_avar,

                               NVPTX::INT_PTX_LDG_G_v2i64_ELE_avar,

                               NVPTX::INT_PTX_LDG_G_v2f32_ELE_avar,

                               NVPTX::INT_PTX_LDG_G_v2f64_ELE_avar);

      break;

    case NVPTXISD::LDUV2:

      Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                               NVPTX::INT_PTX_LDU_G_v2i8_ELE_avar,

                               NVPTX::INT_PTX_LDU_G_v2i16_ELE_avar,

                               NVPTX::INT_PTX_LDU_G_v2i32_ELE_avar,

                               NVPTX::INT_PTX_LDU_G_v2i64_ELE_avar,

                               NVPTX::INT_PTX_LDU_G_v2f32_ELE_avar,

                               NVPTX::INT_PTX_LDU_G_v2f64_ELE_avar);

      break;

    case NVPTXISD::LoadV4:

    case NVPTXISD::LDGV4:

      Opcode = pickOpcodeForVT(

          EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDG_G_v4i8_ELE_avar,

          NVPTX::INT_PTX_LDG_G_v4i16_ELE_avar,

          NVPTX::INT_PTX_LDG_G_v4i32_ELE_avar, std::nullopt,

          NVPTX::INT_PTX_LDG_G_v4f32_ELE_avar, std::nullopt);

      break;

    case NVPTXISD::LDUV4:

      Opcode = pickOpcodeForVT(

          EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDU_G_v4i8_ELE_avar,

          NVPTX::INT_PTX_LDU_G_v4i16_ELE_avar,

          NVPTX::INT_PTX_LDU_G_v4i32_ELE_avar, std::nullopt,

          NVPTX::INT_PTX_LDU_G_v4f32_ELE_avar, std::nullopt);

      break;

    }

    if (!Opcode)

      return false;

    SDValue Ops[] = { Addr, Chain };

    LD = CurDAG->getMachineNode(*Opcode, DL, InstVTList, Ops);

  } else if (TM.is64Bit() ? SelectADDRri64(Op1.getNode(), Op1, Base, Offset)

                          : SelectADDRri(Op1.getNode(), Op1, Base, Offset)) {

    if (TM.is64Bit()) {

      switch (N->getOpcode()) {

      default:

        return false;

      case ISD::LOAD:

      case ISD::INTRINSIC_W_CHAIN:

        if (IsLDG)

          Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                       NVPTX::INT_PTX_LDG_GLOBAL_i8ari64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_i16ari64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_i32ari64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_i64ari64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_f32ari64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_f64ari64);

        else

          Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                       NVPTX::INT_PTX_LDU_GLOBAL_i8ari64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_i16ari64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_i32ari64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_i64ari64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_f32ari64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_f64ari64);

        break;

      case NVPTXISD::LoadV2:

      case NVPTXISD::LDGV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                     NVPTX::INT_PTX_LDG_G_v2i8_ELE_ari64,

                                     NVPTX::INT_PTX_LDG_G_v2i16_ELE_ari64,

                                     NVPTX::INT_PTX_LDG_G_v2i32_ELE_ari64,

                                     NVPTX::INT_PTX_LDG_G_v2i64_ELE_ari64,

                                     NVPTX::INT_PTX_LDG_G_v2f32_ELE_ari64,

                                     NVPTX::INT_PTX_LDG_G_v2f64_ELE_ari64);

        break;

      case NVPTXISD::LDUV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                     NVPTX::INT_PTX_LDU_G_v2i8_ELE_ari64,

                                     NVPTX::INT_PTX_LDU_G_v2i16_ELE_ari64,

                                     NVPTX::INT_PTX_LDU_G_v2i32_ELE_ari64,

                                     NVPTX::INT_PTX_LDU_G_v2i64_ELE_ari64,

                                     NVPTX::INT_PTX_LDU_G_v2f32_ELE_ari64,

                                     NVPTX::INT_PTX_LDU_G_v2f64_ELE_ari64);

        break;

      case NVPTXISD::LoadV4:

      case NVPTXISD::LDGV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDG_G_v4i8_ELE_ari64,

            NVPTX::INT_PTX_LDG_G_v4i16_ELE_ari64,

            NVPTX::INT_PTX_LDG_G_v4i32_ELE_ari64, std::nullopt,

            NVPTX::INT_PTX_LDG_G_v4f32_ELE_ari64, std::nullopt);

        break;

      case NVPTXISD::LDUV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDU_G_v4i8_ELE_ari64,

            NVPTX::INT_PTX_LDU_G_v4i16_ELE_ari64,

            NVPTX::INT_PTX_LDU_G_v4i32_ELE_ari64, std::nullopt,

            NVPTX::INT_PTX_LDU_G_v4f32_ELE_ari64, std::nullopt);

        break;

      }

    } else {

      switch (N->getOpcode()) {

      default:

        return false;

      case ISD::LOAD:

      case ISD::INTRINSIC_W_CHAIN:

        if (IsLDG)

          Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                   NVPTX::INT_PTX_LDG_GLOBAL_i8ari,

                                   NVPTX::INT_PTX_LDG_GLOBAL_i16ari,

                                   NVPTX::INT_PTX_LDG_GLOBAL_i32ari,

                                   NVPTX::INT_PTX_LDG_GLOBAL_i64ari,

                                   NVPTX::INT_PTX_LDG_GLOBAL_f32ari,

                                   NVPTX::INT_PTX_LDG_GLOBAL_f64ari);

        else

          Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                   NVPTX::INT_PTX_LDU_GLOBAL_i8ari,

                                   NVPTX::INT_PTX_LDU_GLOBAL_i16ari,

                                   NVPTX::INT_PTX_LDU_GLOBAL_i32ari,

                                   NVPTX::INT_PTX_LDU_GLOBAL_i64ari,

                                   NVPTX::INT_PTX_LDU_GLOBAL_f32ari,

                                   NVPTX::INT_PTX_LDU_GLOBAL_f64ari);

        break;

      case NVPTXISD::LoadV2:

      case NVPTXISD::LDGV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::INT_PTX_LDG_G_v2i8_ELE_ari32,

                                 NVPTX::INT_PTX_LDG_G_v2i16_ELE_ari32,

                                 NVPTX::INT_PTX_LDG_G_v2i32_ELE_ari32,

                                 NVPTX::INT_PTX_LDG_G_v2i64_ELE_ari32,

                                 NVPTX::INT_PTX_LDG_G_v2f32_ELE_ari32,

                                 NVPTX::INT_PTX_LDG_G_v2f64_ELE_ari32);

        break;

      case NVPTXISD::LDUV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::INT_PTX_LDU_G_v2i8_ELE_ari32,

                                 NVPTX::INT_PTX_LDU_G_v2i16_ELE_ari32,

                                 NVPTX::INT_PTX_LDU_G_v2i32_ELE_ari32,

                                 NVPTX::INT_PTX_LDU_G_v2i64_ELE_ari32,

                                 NVPTX::INT_PTX_LDU_G_v2f32_ELE_ari32,

                                 NVPTX::INT_PTX_LDU_G_v2f64_ELE_ari32);

        break;

      case NVPTXISD::LoadV4:

      case NVPTXISD::LDGV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDG_G_v4i8_ELE_ari32,

            NVPTX::INT_PTX_LDG_G_v4i16_ELE_ari32,

            NVPTX::INT_PTX_LDG_G_v4i32_ELE_ari32, std::nullopt,

            NVPTX::INT_PTX_LDG_G_v4f32_ELE_ari32, std::nullopt);

        break;

      case NVPTXISD::LDUV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDU_G_v4i8_ELE_ari32,

            NVPTX::INT_PTX_LDU_G_v4i16_ELE_ari32,

            NVPTX::INT_PTX_LDU_G_v4i32_ELE_ari32, std::nullopt,

            NVPTX::INT_PTX_LDU_G_v4f32_ELE_ari32, std::nullopt);

        break;

      }

    }

    if (!Opcode)

      return false;

    SDValue Ops[] = {Base, Offset, Chain};

    LD = CurDAG->getMachineNode(*Opcode, DL, InstVTList, Ops);

  } else {

    if (TM.is64Bit()) {

      switch (N->getOpcode()) {

      default:

        return false;

      case ISD::LOAD:

      case ISD::INTRINSIC_W_CHAIN:

        if (IsLDG)

          Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                       NVPTX::INT_PTX_LDG_GLOBAL_i8areg64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_i16areg64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_i32areg64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_i64areg64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_f32areg64,

                                       NVPTX::INT_PTX_LDG_GLOBAL_f64areg64);

        else

          Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                       NVPTX::INT_PTX_LDU_GLOBAL_i8areg64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_i16areg64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_i32areg64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_i64areg64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_f32areg64,

                                       NVPTX::INT_PTX_LDU_GLOBAL_f64areg64);

        break;

      case NVPTXISD::LoadV2:

      case NVPTXISD::LDGV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                     NVPTX::INT_PTX_LDG_G_v2i8_ELE_areg64,

                                     NVPTX::INT_PTX_LDG_G_v2i16_ELE_areg64,

                                     NVPTX::INT_PTX_LDG_G_v2i32_ELE_areg64,

                                     NVPTX::INT_PTX_LDG_G_v2i64_ELE_areg64,

                                     NVPTX::INT_PTX_LDG_G_v2f32_ELE_areg64,

                                     NVPTX::INT_PTX_LDG_G_v2f64_ELE_areg64);

        break;

      case NVPTXISD::LDUV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                     NVPTX::INT_PTX_LDU_G_v2i8_ELE_areg64,

                                     NVPTX::INT_PTX_LDU_G_v2i16_ELE_areg64,

                                     NVPTX::INT_PTX_LDU_G_v2i32_ELE_areg64,

                                     NVPTX::INT_PTX_LDU_G_v2i64_ELE_areg64,

                                     NVPTX::INT_PTX_LDU_G_v2f32_ELE_areg64,

                                     NVPTX::INT_PTX_LDU_G_v2f64_ELE_areg64);

        break;

      case NVPTXISD::LoadV4:

      case NVPTXISD::LDGV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDG_G_v4i8_ELE_areg64,

            NVPTX::INT_PTX_LDG_G_v4i16_ELE_areg64,

            NVPTX::INT_PTX_LDG_G_v4i32_ELE_areg64, std::nullopt,

            NVPTX::INT_PTX_LDG_G_v4f32_ELE_areg64, std::nullopt);

        break;

      case NVPTXISD::LDUV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDU_G_v4i8_ELE_areg64,

            NVPTX::INT_PTX_LDU_G_v4i16_ELE_areg64,

            NVPTX::INT_PTX_LDU_G_v4i32_ELE_areg64, std::nullopt,

            NVPTX::INT_PTX_LDU_G_v4f32_ELE_areg64, std::nullopt);

        break;

      }

    } else {

      switch (N->getOpcode()) {

      default:

        return false;

      case ISD::LOAD:

      case ISD::INTRINSIC_W_CHAIN:

        if (IsLDG)

          Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                   NVPTX::INT_PTX_LDG_GLOBAL_i8areg,

                                   NVPTX::INT_PTX_LDG_GLOBAL_i16areg,

                                   NVPTX::INT_PTX_LDG_GLOBAL_i32areg,

                                   NVPTX::INT_PTX_LDG_GLOBAL_i64areg,

                                   NVPTX::INT_PTX_LDG_GLOBAL_f32areg,

                                   NVPTX::INT_PTX_LDG_GLOBAL_f64areg);

        else

          Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                   NVPTX::INT_PTX_LDU_GLOBAL_i8areg,

                                   NVPTX::INT_PTX_LDU_GLOBAL_i16areg,

                                   NVPTX::INT_PTX_LDU_GLOBAL_i32areg,

                                   NVPTX::INT_PTX_LDU_GLOBAL_i64areg,

                                   NVPTX::INT_PTX_LDU_GLOBAL_f32areg,

                                   NVPTX::INT_PTX_LDU_GLOBAL_f64areg);

        break;

      case NVPTXISD::LoadV2:

      case NVPTXISD::LDGV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::INT_PTX_LDG_G_v2i8_ELE_areg32,

                                 NVPTX::INT_PTX_LDG_G_v2i16_ELE_areg32,

                                 NVPTX::INT_PTX_LDG_G_v2i32_ELE_areg32,

                                 NVPTX::INT_PTX_LDG_G_v2i64_ELE_areg32,

                                 NVPTX::INT_PTX_LDG_G_v2f32_ELE_areg32,

                                 NVPTX::INT_PTX_LDG_G_v2f64_ELE_areg32);

        break;

      case NVPTXISD::LDUV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::INT_PTX_LDU_G_v2i8_ELE_areg32,

                                 NVPTX::INT_PTX_LDU_G_v2i16_ELE_areg32,

                                 NVPTX::INT_PTX_LDU_G_v2i32_ELE_areg32,

                                 NVPTX::INT_PTX_LDU_G_v2i64_ELE_areg32,

                                 NVPTX::INT_PTX_LDU_G_v2f32_ELE_areg32,

                                 NVPTX::INT_PTX_LDU_G_v2f64_ELE_areg32);

        break;

      case NVPTXISD::LoadV4:

      case NVPTXISD::LDGV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDG_G_v4i8_ELE_areg32,

            NVPTX::INT_PTX_LDG_G_v4i16_ELE_areg32,

            NVPTX::INT_PTX_LDG_G_v4i32_ELE_areg32, std::nullopt,

            NVPTX::INT_PTX_LDG_G_v4f32_ELE_areg32, std::nullopt);

        break;

      case NVPTXISD::LDUV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::INT_PTX_LDU_G_v4i8_ELE_areg32,

            NVPTX::INT_PTX_LDU_G_v4i16_ELE_areg32,

            NVPTX::INT_PTX_LDU_G_v4i32_ELE_areg32, std::nullopt,

            NVPTX::INT_PTX_LDU_G_v4f32_ELE_areg32, std::nullopt);

        break;

      }

    }

    if (!Opcode)

      return false;

    SDValue Ops[] = { Op1, Chain };

    LD = CurDAG->getMachineNode(*Opcode, DL, InstVTList, Ops);

  }


  // For automatic generation of LDG (through SelectLoad[Vector], not the

  // intrinsics), we may have an extending load like:

  //

  //   i32,ch = load<LD1[%data1(addrspace=1)], zext from i8> t0, t7, undef:i64

  //

  // In this case, the matching logic above will select a load for the original

  // memory type (in this case, i8) and our types will not match (the node needs

  // to return an i32 in this case). Our LDG/LDU nodes do not support the

  // concept of sign-/zero-extension, so emulate it here by adding an explicit

  // CVT instruction. Ptxas should clean up any redundancies here.


  LoadSDNode *LdNode = dyn_cast<LoadSDNode>(N);


  if (OrigType != EltVT &&

      (LdNode || (OrigType.isFloatingPoint() && EltVT.isFloatingPoint()))) {

    // We have an extending-load. The instruction we selected operates on the

    // smaller type, but the SDNode we are replacing has the larger type. We

    // need to emit a CVT to make the types match.

    unsigned CvtOpc =

        GetConvertOpcode(OrigType.getSimpleVT(), EltVT.getSimpleVT(), LdNode);


    // For each output value, apply the manual sign/zero-extension and make sure

    // all users of the load go through that CVT.

    for (unsigned i = 0; i != NumElts; ++i) {

      SDValue Res(LD, i);

      SDValue OrigVal(N, i);


      SDNode *CvtNode =

        CurDAG->getMachineNode(CvtOpc, DL, OrigType, Res,

                               CurDAG->getTargetConstant(NVPTX::PTXCvtMode::NONE,

                                                         DL, MVT::i32));

      ReplaceUses(OrigVal, SDValue(CvtNode, 0));

    }

  }


  ReplaceNode(N, LD);

  return true;

}


bool NVPTXDAGToDAGISel::tryStore(SDNode *N) {

  SDLoc dl(N);

  MemSDNode *ST = cast<MemSDNode>(N);

  assert(ST->writeMem() && "Expected store");

  StoreSDNode *PlainStore = dyn_cast<StoreSDNode>(N);

  AtomicSDNode *AtomicStore = dyn_cast<AtomicSDNode>(N);

  assert((PlainStore || AtomicStore) && "Expected store");

  EVT StoreVT = ST->getMemoryVT();

  SDNode *NVPTXST = nullptr;


  // do not support pre/post inc/dec

  if (PlainStore && PlainStore->isIndexed())

    return false;


  if (!StoreVT.isSimple())

    return false;


  AtomicOrdering Ordering = ST->getSuccessOrdering();

  // In order to lower atomic loads with stronger guarantees we would need to

  // use store.release or insert fences. However these features were only added

  // with PTX ISA 6.0 / sm_70.

  // TODO: Check if we can actually use the new instructions and implement them.

  if (isStrongerThanMonotonic(Ordering))

    return false;


  // Address Space Setting

  unsigned int CodeAddrSpace = getCodeAddrSpace(ST);

  unsigned int PointerSize =

      CurDAG->getDataLayout().getPointerSizeInBits(ST->getAddressSpace());


  // Volatile Setting

  // - .volatile is only available for .global and .shared

  // - .volatile has the same memory synchronization semantics as .relaxed.sys

  bool isVolatile = ST->isVolatile() || Ordering == AtomicOrdering::Monotonic;

  if (CodeAddrSpace != NVPTX::PTXLdStInstCode::GLOBAL &&

      CodeAddrSpace != NVPTX::PTXLdStInstCode::SHARED &&

      CodeAddrSpace != NVPTX::PTXLdStInstCode::GENERIC)

    isVolatile = false;


  // Vector Setting

  MVT SimpleVT = StoreVT.getSimpleVT();

  unsigned vecType = NVPTX::PTXLdStInstCode::Scalar;


  // Type Setting: toType + toTypeWidth

  // - for integer type, always use 'u'

  //

  MVT ScalarVT = SimpleVT.getScalarType();

  unsigned toTypeWidth = ScalarVT.getSizeInBits();

  if (SimpleVT.isVector()) {

    assert((Isv2x16VT(StoreVT) || StoreVT == MVT::v4i8) &&

           "Unexpected vector type");

    // v2x16 is stored using st.b32

    toTypeWidth = 32;

  }


  unsigned int toType = getLdStRegType(ScalarVT);


  // Create the machine instruction DAG

  SDValue Chain = ST->getChain();

  SDValue Value = PlainStore ? PlainStore->getValue() : AtomicStore->getVal();

  SDValue BasePtr = ST->getBasePtr();

  SDValue Addr;

  SDValue Offset, Base;

  std::optional<unsigned> Opcode;

  MVT::SimpleValueType SourceVT =

      Value.getNode()->getSimpleValueType(0).SimpleTy;


  if (SelectDirectAddr(BasePtr, Addr)) {

    Opcode = pickOpcodeForVT(SourceVT, NVPTX::ST_i8_avar, NVPTX::ST_i16_avar,

                             NVPTX::ST_i32_avar, NVPTX::ST_i64_avar,

                             NVPTX::ST_f32_avar, NVPTX::ST_f64_avar);

    if (!Opcode)

      return false;

    SDValue Ops[] = {Value,

                     getI32Imm(isVolatile, dl),

                     getI32Imm(CodeAddrSpace, dl),

                     getI32Imm(vecType, dl),

                     getI32Imm(toType, dl),

                     getI32Imm(toTypeWidth, dl),

                     Addr,

                     Chain};

    NVPTXST = CurDAG->getMachineNode(*Opcode, dl, MVT::Other, Ops);

  } else if (PointerSize == 64

                 ? SelectADDRsi64(BasePtr.getNode(), BasePtr, Base, Offset)

                 : SelectADDRsi(BasePtr.getNode(), BasePtr, Base, Offset)) {

    Opcode = pickOpcodeForVT(SourceVT, NVPTX::ST_i8_asi, NVPTX::ST_i16_asi,

                             NVPTX::ST_i32_asi, NVPTX::ST_i64_asi,

                             NVPTX::ST_f32_asi, NVPTX::ST_f64_asi);

    if (!Opcode)

      return false;

    SDValue Ops[] = {Value,

                     getI32Imm(isVolatile, dl),

                     getI32Imm(CodeAddrSpace, dl),

                     getI32Imm(vecType, dl),

                     getI32Imm(toType, dl),

                     getI32Imm(toTypeWidth, dl),

                     Base,

                     Offset,

                     Chain};

    NVPTXST = CurDAG->getMachineNode(*Opcode, dl, MVT::Other, Ops);

  } else if (PointerSize == 64

                 ? SelectADDRri64(BasePtr.getNode(), BasePtr, Base, Offset)

                 : SelectADDRri(BasePtr.getNode(), BasePtr, Base, Offset)) {

    if (PointerSize == 64)

      Opcode =

          pickOpcodeForVT(SourceVT, NVPTX::ST_i8_ari_64, NVPTX::ST_i16_ari_64,

                          NVPTX::ST_i32_ari_64, NVPTX::ST_i64_ari_64,

                          NVPTX::ST_f32_ari_64, NVPTX::ST_f64_ari_64);

    else

      Opcode = pickOpcodeForVT(SourceVT, NVPTX::ST_i8_ari, NVPTX::ST_i16_ari,

                               NVPTX::ST_i32_ari, NVPTX::ST_i64_ari,

                               NVPTX::ST_f32_ari, NVPTX::ST_f64_ari);

    if (!Opcode)

      return false;


    SDValue Ops[] = {Value,

                     getI32Imm(isVolatile, dl),

                     getI32Imm(CodeAddrSpace, dl),

                     getI32Imm(vecType, dl),

                     getI32Imm(toType, dl),

                     getI32Imm(toTypeWidth, dl),

                     Base,

                     Offset,

                     Chain};

    NVPTXST = CurDAG->getMachineNode(*Opcode, dl, MVT::Other, Ops);

  } else {

    if (PointerSize == 64)

      Opcode =

          pickOpcodeForVT(SourceVT, NVPTX::ST_i8_areg_64, NVPTX::ST_i16_areg_64,

                          NVPTX::ST_i32_areg_64, NVPTX::ST_i64_areg_64,

                          NVPTX::ST_f32_areg_64, NVPTX::ST_f64_areg_64);

    else

      Opcode = pickOpcodeForVT(SourceVT, NVPTX::ST_i8_areg, NVPTX::ST_i16_areg,

                               NVPTX::ST_i32_areg, NVPTX::ST_i64_areg,

                               NVPTX::ST_f32_areg, NVPTX::ST_f64_areg);

    if (!Opcode)

      return false;

    SDValue Ops[] = {Value,

                     getI32Imm(isVolatile, dl),

                     getI32Imm(CodeAddrSpace, dl),

                     getI32Imm(vecType, dl),

                     getI32Imm(toType, dl),

                     getI32Imm(toTypeWidth, dl),

                     BasePtr,

                     Chain};

    NVPTXST = CurDAG->getMachineNode(*Opcode, dl, MVT::Other, Ops);

  }


  if (!NVPTXST)

    return false;


  MachineMemOperand *MemRef = cast<MemSDNode>(N)->getMemOperand();

  CurDAG->setNodeMemRefs(cast<MachineSDNode>(NVPTXST), {MemRef});

  ReplaceNode(N, NVPTXST);

  return true;

}


bool NVPTXDAGToDAGISel::tryStoreVector(SDNode *N) {

  SDValue Chain = N->getOperand(0);

  SDValue Op1 = N->getOperand(1);

  SDValue Addr, Offset, Base;

  std::optional<unsigned> Opcode;

  SDLoc DL(N);

  SDNode *ST;

  EVT EltVT = Op1.getValueType();

  MemSDNode *MemSD = cast<MemSDNode>(N);

  EVT StoreVT = MemSD->getMemoryVT();


  // Address Space Setting

  unsigned CodeAddrSpace = getCodeAddrSpace(MemSD);

  if (CodeAddrSpace == NVPTX::PTXLdStInstCode::CONSTANT) {

    report_fatal_error("Cannot store to pointer that points to constant "

                       "memory space");

  }

  unsigned int PointerSize =

      CurDAG->getDataLayout().getPointerSizeInBits(MemSD->getAddressSpace());


  // Volatile Setting

  // - .volatile is only availalble for .global and .shared

  bool IsVolatile = MemSD->isVolatile();

  if (CodeAddrSpace != NVPTX::PTXLdStInstCode::GLOBAL &&

      CodeAddrSpace != NVPTX::PTXLdStInstCode::SHARED &&

      CodeAddrSpace != NVPTX::PTXLdStInstCode::GENERIC)

    IsVolatile = false;


  // Type Setting: toType + toTypeWidth

  // - for integer type, always use 'u'

  assert(StoreVT.isSimple() && "Store value is not simple");

  MVT ScalarVT = StoreVT.getSimpleVT().getScalarType();

  unsigned ToTypeWidth = ScalarVT.getSizeInBits();

  unsigned ToType = getLdStRegType(ScalarVT);


  SmallVector<SDValue, 12> StOps;

  SDValue N2;

  unsigned VecType;


  switch (N->getOpcode()) {

  case NVPTXISD::StoreV2:

    VecType = NVPTX::PTXLdStInstCode::V2;

    StOps.push_back(N->getOperand(1));

    StOps.push_back(N->getOperand(2));

    N2 = N->getOperand(3);

    break;

  case NVPTXISD::StoreV4:

    VecType = NVPTX::PTXLdStInstCode::V4;

    StOps.push_back(N->getOperand(1));

    StOps.push_back(N->getOperand(2));

    StOps.push_back(N->getOperand(3));

    StOps.push_back(N->getOperand(4));

    N2 = N->getOperand(5);

    break;

  default:

    return false;

  }


  // v8x16 is a special case. PTX doesn't have st.v8.x16

  // instruction. Instead, we split the vector into v2x16 chunks and

  // store them with st.v4.b32.

  if (Isv2x16VT(EltVT)) {

    assert(N->getOpcode() == NVPTXISD::StoreV4 && "Unexpected load opcode.");

    EltVT = MVT::i32;

    ToType = NVPTX::PTXLdStInstCode::Untyped;

    ToTypeWidth = 32;

  }


  StOps.push_back(getI32Imm(IsVolatile, DL));

  StOps.push_back(getI32Imm(CodeAddrSpace, DL));

  StOps.push_back(getI32Imm(VecType, DL));

  StOps.push_back(getI32Imm(ToType, DL));

  StOps.push_back(getI32Imm(ToTypeWidth, DL));


  if (SelectDirectAddr(N2, Addr)) {

    switch (N->getOpcode()) {

    default:

      return false;

    case NVPTXISD::StoreV2:

      Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                               NVPTX::STV_i8_v2_avar, NVPTX::STV_i16_v2_avar,

                               NVPTX::STV_i32_v2_avar, NVPTX::STV_i64_v2_avar,

                               NVPTX::STV_f32_v2_avar, NVPTX::STV_f64_v2_avar);

      break;

    case NVPTXISD::StoreV4:

      Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                               NVPTX::STV_i8_v4_avar, NVPTX::STV_i16_v4_avar,

                               NVPTX::STV_i32_v4_avar, std::nullopt,

                               NVPTX::STV_f32_v4_avar, std::nullopt);

      break;

    }

    StOps.push_back(Addr);

  } else if (PointerSize == 64 ? SelectADDRsi64(N2.getNode(), N2, Base, Offset)

                               : SelectADDRsi(N2.getNode(), N2, Base, Offset)) {

    switch (N->getOpcode()) {

    default:

      return false;

    case NVPTXISD::StoreV2:

      Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                               NVPTX::STV_i8_v2_asi, NVPTX::STV_i16_v2_asi,

                               NVPTX::STV_i32_v2_asi, NVPTX::STV_i64_v2_asi,

                               NVPTX::STV_f32_v2_asi, NVPTX::STV_f64_v2_asi);

      break;

    case NVPTXISD::StoreV4:

      Opcode =

          pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy, NVPTX::STV_i8_v4_asi,

                          NVPTX::STV_i16_v4_asi, NVPTX::STV_i32_v4_asi,

                          std::nullopt, NVPTX::STV_f32_v4_asi, std::nullopt);

      break;

    }

    StOps.push_back(Base);

    StOps.push_back(Offset);

  } else if (PointerSize == 64 ? SelectADDRri64(N2.getNode(), N2, Base, Offset)

                               : SelectADDRri(N2.getNode(), N2, Base, Offset)) {

    if (PointerSize == 64) {

      switch (N->getOpcode()) {

      default:

        return false;

      case NVPTXISD::StoreV2:

        Opcode =

            pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                            NVPTX::STV_i8_v2_ari_64, NVPTX::STV_i16_v2_ari_64,

                            NVPTX::STV_i32_v2_ari_64, NVPTX::STV_i64_v2_ari_64,

                            NVPTX::STV_f32_v2_ari_64, NVPTX::STV_f64_v2_ari_64);

        break;

      case NVPTXISD::StoreV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::STV_i8_v4_ari_64,

            NVPTX::STV_i16_v4_ari_64, NVPTX::STV_i32_v4_ari_64, std::nullopt,

            NVPTX::STV_f32_v4_ari_64, std::nullopt);

        break;

      }

    } else {

      switch (N->getOpcode()) {

      default:

        return false;

      case NVPTXISD::StoreV2:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::STV_i8_v2_ari, NVPTX::STV_i16_v2_ari,

                                 NVPTX::STV_i32_v2_ari, NVPTX::STV_i64_v2_ari,

                                 NVPTX::STV_f32_v2_ari, NVPTX::STV_f64_v2_ari);

        break;

      case NVPTXISD::StoreV4:

        Opcode = pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy,

                                 NVPTX::STV_i8_v4_ari, NVPTX::STV_i16_v4_ari,

                                 NVPTX::STV_i32_v4_ari, std::nullopt,

                                 NVPTX::STV_f32_v4_ari, std::nullopt);

        break;

      }

    }

    StOps.push_back(Base);

    StOps.push_back(Offset);

  } else {

    if (PointerSize == 64) {

      switch (N->getOpcode()) {

      default:

        return false;

      case NVPTXISD::StoreV2:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::STV_i8_v2_areg_64,

            NVPTX::STV_i16_v2_areg_64, NVPTX::STV_i32_v2_areg_64,

            NVPTX::STV_i64_v2_areg_64, NVPTX::STV_f32_v2_areg_64,

            NVPTX::STV_f64_v2_areg_64);

        break;

      case NVPTXISD::StoreV4:

        Opcode = pickOpcodeForVT(

            EltVT.getSimpleVT().SimpleTy, NVPTX::STV_i8_v4_areg_64,

            NVPTX::STV_i16_v4_areg_64, NVPTX::STV_i32_v4_areg_64, std::nullopt,

            NVPTX::STV_f32_v4_areg_64, std::nullopt);

        break;

      }

    } else {

      switch (N->getOpcode()) {

      default:

        return false;

      case NVPTXISD::StoreV2:

        Opcode =

            pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy, NVPTX::STV_i8_v2_areg,

                            NVPTX::STV_i16_v2_areg, NVPTX::STV_i32_v2_areg,

                            NVPTX::STV_i64_v2_areg, NVPTX::STV_f32_v2_areg,

                            NVPTX::STV_f64_v2_areg);

        break;

      case NVPTXISD::StoreV4:

        Opcode =

            pickOpcodeForVT(EltVT.getSimpleVT().SimpleTy, NVPTX::STV_i8_v4_areg,

                            NVPTX::STV_i16_v4_areg, NVPTX::STV_i32_v4_areg,

                            std::nullopt, NVPTX::STV_f32_v4_areg, std::nullopt);

        break;

      }

    }

    StOps.push_back(N2);

  }


  if (!Opcode)

    return false;


  StOps.push_back(Chain);


  ST = CurDAG->getMachineNode(*Opcode, DL, MVT::Other, StOps);


  MachineMemOperand *MemRef = cast<MemSDNode>(N)->getMemOperand();

  CurDAG->setNodeMemRefs(cast<MachineSDNode>(ST), {MemRef});


  ReplaceNode(N, ST);

  return true;

}


bool NVPTXDAGToDAGISel::tryLoadParam(SDNode *Node) {

  SDValue Chain = Node->getOperand(0);

  SDValue Offset = Node->getOperand(2);

  SDValue Glue = Node->getOperand(3);

  SDLoc DL(Node);

  MemSDNode *Mem = cast<MemSDNode>(Node);


  unsigned VecSize;

  switch (Node->getOpcode()) {

  default:

    return false;

  case NVPTXISD::LoadParam:

    VecSize = 1;

    break;

  case NVPTXISD::LoadParamV2:

    VecSize = 2;

    break;

  case NVPTXISD::LoadParamV4:

    VecSize = 4;

    break;

  }


  EVT EltVT = Node->getValueType(0);

  EVT MemVT = Mem->getMemoryVT();


  std::optional<unsigned> Opcode;


  switch (VecSize) {

  default:

    return false;

  case 1:

    Opcode = pickOpcodeForVT(MemVT.getSimpleVT().SimpleTy,

                             NVPTX::LoadParamMemI8, NVPTX::LoadParamMemI16,

                             NVPTX::LoadParamMemI32, NVPTX::LoadParamMemI64,

                             NVPTX::LoadParamMemF32, NVPTX::LoadParamMemF64);

    break;

  case 2:

    Opcode =

        pickOpcodeForVT(MemVT.getSimpleVT().SimpleTy, NVPTX::LoadParamMemV2I8,

                        NVPTX::LoadParamMemV2I16, NVPTX::LoadParamMemV2I32,

                        NVPTX::LoadParamMemV2I64, NVPTX::LoadParamMemV2F32,

                        NVPTX::LoadParamMemV2F64);

    break;

  case 4:

    Opcode =

        pickOpcodeForVT(MemVT.getSimpleVT().SimpleTy, NVPTX::LoadParamMemV4I8,

                        NVPTX::LoadParamMemV4I16, NVPTX::LoadParamMemV4I32,

                        std::nullopt, NVPTX::LoadParamMemV4F32, std::nullopt);

    break;

  }

  if (!Opcode)

    return false;


  SDVTList VTs;

  if (VecSize == 1) {

    VTs = CurDAG->getVTList(EltVT, MVT::Other, MVT::Glue);

  } else if (VecSize == 2) {

    VTs = CurDAG->getVTList(EltVT, EltVT, MVT::Other, MVT::Glue);

  } else {

    EVT EVTs[] = { EltVT, EltVT, EltVT, EltVT, MVT::Other, MVT::Glue };

    VTs = CurDAG->getVTList(EVTs);

  }


  unsigned OffsetVal = Offset->getAsZExtVal();


  SmallVector<SDValue, 2> Ops;

  Ops.push_back(CurDAG->getTargetConstant(OffsetVal, DL, MVT::i32));

  Ops.push_back(Chain);

  Ops.push_back(Glue);


  ReplaceNode(Node, CurDAG->getMachineNode(*Opcode, DL, VTs, Ops));

  return true;

}


bool NVPTXDAGToDAGISel::tryStoreRetval(SDNode *N) {

  SDLoc DL(N);

  SDValue Chain = N->getOperand(0);

  SDValue Offset = N->getOperand(1);

  unsigned OffsetVal = Offset->getAsZExtVal();

  MemSDNode *Mem = cast<MemSDNode>(N);


  // How many elements do we have?

  unsigned NumElts = 1;

  switch (N->getOpcode()) {

  default:

    return false;

  case NVPTXISD::StoreRetval:

    NumElts = 1;

    break;

  case NVPTXISD::StoreRetvalV2:

    NumElts = 2;

    break;

  case NVPTXISD::StoreRetvalV4:

    NumElts = 4;

    break;

  }


  // Build vector of operands

  SmallVector<SDValue, 6> Ops;

  for (unsigned i = 0; i < NumElts; ++i)

    Ops.push_back(N->getOperand(i + 2));

  Ops.push_back(CurDAG->getTargetConstant(OffsetVal, DL, MVT::i32));

  Ops.push_back(Chain);


  // Determine target opcode

  // If we have an i1, use an 8-bit store. The lowering code in

  // NVPTXISelLowering will have already emitted an upcast.

  std::optional<unsigned> Opcode = 0;

  switch (NumElts) {

  default:

    return false;

  case 1:

    Opcode = pickOpcodeForVT(Mem->getMemoryVT().getSimpleVT().SimpleTy,

                             NVPTX::StoreRetvalI8, NVPTX::StoreRetvalI16,

                             NVPTX::StoreRetvalI32, NVPTX::StoreRetvalI64,

                             NVPTX::StoreRetvalF32, NVPTX::StoreRetvalF64);

    if (Opcode == NVPTX::StoreRetvalI8) {

      // Fine tune the opcode depending on the size of the operand.

      // This helps to avoid creating redundant COPY instructions in

      // InstrEmitter::AddRegisterOperand().

      switch (Ops[0].getSimpleValueType().SimpleTy) {

      default:

        break;

      case MVT::i32:

        Opcode = NVPTX::StoreRetvalI8TruncI32;

        break;

      case MVT::i64:

        Opcode = NVPTX::StoreRetvalI8TruncI64;

        break;

      }

    }

    break;

  case 2:

    Opcode = pickOpcodeForVT(Mem->getMemoryVT().getSimpleVT().SimpleTy,

                             NVPTX::StoreRetvalV2I8, NVPTX::StoreRetvalV2I16,

                             NVPTX::StoreRetvalV2I32, NVPTX::StoreRetvalV2I64,

                             NVPTX::StoreRetvalV2F32, NVPTX::StoreRetvalV2F64);

    break;

  case 4:

    Opcode = pickOpcodeForVT(Mem->getMemoryVT().getSimpleVT().SimpleTy,

                             NVPTX::StoreRetvalV4I8, NVPTX::StoreRetvalV4I16,

                             NVPTX::StoreRetvalV4I32, std::nullopt,

                             NVPTX::StoreRetvalV4F32, std::nullopt);

    break;

  }

  if (!Opcode)

    return false;


  SDNode *Ret = CurDAG->getMachineNode(*Opcode, DL, MVT::Other, Ops);

  MachineMemOperand *MemRef = cast<MemSDNode>(N)->getMemOperand();

  CurDAG->setNodeMemRefs(cast<MachineSDNode>(Ret), {MemRef});


  ReplaceNode(N, Ret);

  return true;

}


// Helpers for constructing opcode (ex: NVPTX::StoreParamV4F32_iiri)

#define getOpcV2H(ty, opKind0, opKind1)                                        \

  NVPTX::StoreParamV2##ty##_##opKind0##opKind1


#define getOpcV2H1(ty, opKind0, isImm1)                                        \

  (isImm1) ? getOpcV2H(ty, opKind0, i) : getOpcV2H(ty, opKind0, r)


#define getOpcodeForVectorStParamV2(ty, isimm)                                 \

  (isimm[0]) ? getOpcV2H1(ty, i, isimm[1]) : getOpcV2H1(ty, r, isimm[1])


#define getOpcV4H(ty, opKind0, opKind1, opKind2, opKind3)                      \

  NVPTX::StoreParamV4##ty##_##opKind0##opKind1##opKind2##opKind3


#define getOpcV4H3(ty, opKind0, opKind1, opKind2, isImm3)                      \

  (isImm3) ? getOpcV4H(ty, opKind0, opKind1, opKind2, i)                       \

           : getOpcV4H(ty, opKind0, opKind1, opKind2, r)


#define getOpcV4H2(ty, opKind0, opKind1, isImm2, isImm3)                       \

  (isImm2) ? getOpcV4H3(ty, opKind0, opKind1, i, isImm3)                       \

           : getOpcV4H3(ty, opKind0, opKind1, r, isImm3)


#define getOpcV4H1(ty, opKind0, isImm1, isImm2, isImm3)                        \

  (isImm1) ? getOpcV4H2(ty, opKind0, i, isImm2, isImm3)                        \

           : getOpcV4H2(ty, opKind0, r, isImm2, isImm3)


#define getOpcodeForVectorStParamV4(ty, isimm)                                 \

  (isimm[0]) ? getOpcV4H1(ty, i, isimm[1], isimm[2], isimm[3])                 \

             : getOpcV4H1(ty, r, isimm[1], isimm[2], isimm[3])


#define getOpcodeForVectorStParam(n, ty, isimm)                                \

  (n == 2) ? getOpcodeForVectorStParamV2(ty, isimm)                            \

           : getOpcodeForVectorStParamV4(ty, isimm)


static unsigned pickOpcodeForVectorStParam(SmallVector<SDValue, 8> &Ops,

                                           unsigned NumElts,

                                           MVT::SimpleValueType MemTy,

                                           SelectionDAG *CurDAG, SDLoc DL) {

  // Determine which inputs are registers and immediates make new operators

  // with constant values

  SmallVector<bool, 4> IsImm(NumElts, false);

  for (unsigned i = 0; i < NumElts; i++) {

    IsImm[i] = (isa<ConstantSDNode>(Ops[i]) || isa<ConstantFPSDNode>(Ops[i]));

    if (IsImm[i]) {

      SDValue Imm = Ops[i];

      if (MemTy == MVT::f32 || MemTy == MVT::f64) {

        const ConstantFPSDNode *ConstImm = cast<ConstantFPSDNode>(Imm);

        const ConstantFP *CF = ConstImm->getConstantFPValue();

        Imm = CurDAG->getTargetConstantFP(*CF, DL, Imm->getValueType(0));

      } else {

        const ConstantSDNode *ConstImm = cast<ConstantSDNode>(Imm);

        const ConstantInt *CI = ConstImm->getConstantIntValue();

        Imm = CurDAG->getTargetConstant(*CI, DL, Imm->getValueType(0));

      }

      Ops[i] = Imm;

    }

  }


  // Get opcode for MemTy, size, and register/immediate operand ordering

  switch (MemTy) {

  case MVT::i8:

    return getOpcodeForVectorStParam(NumElts, I8, IsImm);

  case MVT::i16:

    return getOpcodeForVectorStParam(NumElts, I16, IsImm);

  case MVT::i32:

    return getOpcodeForVectorStParam(NumElts, I32, IsImm);

  case MVT::i64:

    assert(NumElts == 2 && "MVT too large for NumElts > 2");

    return getOpcodeForVectorStParamV2(I64, IsImm);

  case MVT::f32:

    return getOpcodeForVectorStParam(NumElts, F32, IsImm);

  case MVT::f64:

    assert(NumElts == 2 && "MVT too large for NumElts > 2");

    return getOpcodeForVectorStParamV2(F64, IsImm);


  // These cases don't support immediates, just use the all register version

  // and generate moves.

  case MVT::i1:

    return (NumElts == 2) ? NVPTX::StoreParamV2I8_rr

                          : NVPTX::StoreParamV4I8_rrrr;

  case MVT::f16:

  case MVT::bf16:

    return (NumElts == 2) ? NVPTX::StoreParamV2I16_rr

                          : NVPTX::StoreParamV4I16_rrrr;

  case MVT::v2f16:

  case MVT::v2bf16:

  case MVT::v2i16:

  case MVT::v4i8:

    return (NumElts == 2) ? NVPTX::StoreParamV2I32_rr

                          : NVPTX::StoreParamV4I32_rrrr;

  default:

    llvm_unreachable("Cannot select st.param for unknown MemTy");

  }

}


bool NVPTXDAGToDAGISel::tryStoreParam(SDNode *N) {

  SDLoc DL(N);

  SDValue Chain = N->getOperand(0);

  SDValue Param = N->getOperand(1);

  unsigned ParamVal = Param->getAsZExtVal();

  SDValue Offset = N->getOperand(2);

  unsigned OffsetVal = Offset->getAsZExtVal();

  MemSDNode *Mem = cast<MemSDNode>(N);

  SDValue Glue = N->getOperand(N->getNumOperands() - 1);


  // How many elements do we have?

  unsigned NumElts;

  switch (N->getOpcode()) {

  default:

    llvm_unreachable("Unexpected opcode");

  case NVPTXISD::StoreParamU32:

  case NVPTXISD::StoreParamS32:

  case NVPTXISD::StoreParam:

    NumElts = 1;

    break;

  case NVPTXISD::StoreParamV2:

    NumElts = 2;

    break;

  case NVPTXISD::StoreParamV4:

    NumElts = 4;

    break;

  }


  // Build vector of operands

  SmallVector<SDValue, 8> Ops;

  for (unsigned i = 0; i < NumElts; ++i)

    Ops.push_back(N->getOperand(i + 3));

  Ops.push_back(CurDAG->getTargetConstant(ParamVal, DL, MVT::i32));

  Ops.push_back(CurDAG->getTargetConstant(OffsetVal, DL, MVT::i32));

  Ops.push_back(Chain);

  Ops.push_back(Glue);


  // Determine target opcode

  // If we have an i1, use an 8-bit store. The lowering code in

  // NVPTXISelLowering will have already emitted an upcast.

  std::optional<unsigned> Opcode;

  switch (N->getOpcode()) {

  default:

    switch (NumElts) {

    default:

      llvm_unreachable("Unexpected NumElts");

    case 1: {

      MVT::SimpleValueType MemTy = Mem->getMemoryVT().getSimpleVT().SimpleTy;

      SDValue Imm = Ops[0];

      if (MemTy != MVT::f16 && MemTy != MVT::v2f16 &&

          (isa<ConstantSDNode>(Imm) || isa<ConstantFPSDNode>(Imm))) {

        // Convert immediate to target constant

        if (MemTy == MVT::f32 || MemTy == MVT::f64) {

          const ConstantFPSDNode *ConstImm = cast<ConstantFPSDNode>(Imm);

          const ConstantFP *CF = ConstImm->getConstantFPValue();

          Imm = CurDAG->getTargetConstantFP(*CF, DL, Imm->getValueType(0));

        } else {

          const ConstantSDNode *ConstImm = cast<ConstantSDNode>(Imm);

          const ConstantInt *CI = ConstImm->getConstantIntValue();

          Imm = CurDAG->getTargetConstant(*CI, DL, Imm->getValueType(0));

        }

        Ops[0] = Imm;

        // Use immediate version of store param

        Opcode = pickOpcodeForVT(MemTy, NVPTX::StoreParamI8_i,

                                 NVPTX::StoreParamI16_i, NVPTX::StoreParamI32_i,

                                 NVPTX::StoreParamI64_i, NVPTX::StoreParamF32_i,

                                 NVPTX::StoreParamF64_i);

      } else

        Opcode =

            pickOpcodeForVT(Mem->getMemoryVT().getSimpleVT().SimpleTy,

                            NVPTX::StoreParamI8_r, NVPTX::StoreParamI16_r,

                            NVPTX::StoreParamI32_r, NVPTX::StoreParamI64_r,

                            NVPTX::StoreParamF32_r, NVPTX::StoreParamF64_r);

      if (Opcode == NVPTX::StoreParamI8_r) {

        // Fine tune the opcode depending on the size of the operand.

        // This helps to avoid creating redundant COPY instructions in

        // InstrEmitter::AddRegisterOperand().

        switch (Ops[0].getSimpleValueType().SimpleTy) {

        default:

          break;

        case MVT::i32:

          Opcode = NVPTX::StoreParamI8TruncI32_r;

          break;

        case MVT::i64:

          Opcode = NVPTX::StoreParamI8TruncI64_r;

          break;

        }

      }

      break;

    }

    case 2:

    case 4: {

      MVT::SimpleValueType MemTy = Mem->getMemoryVT().getSimpleVT().SimpleTy;

      Opcode = pickOpcodeForVectorStParam(Ops, NumElts, MemTy, CurDAG, DL);

      break;

    }

    }

    break;

  // Special case: if we have a sign-extend/zero-extend node, insert the

  // conversion instruction first, and use that as the value operand to

  // the selected StoreParam node.

  case NVPTXISD::StoreParamU32: {

    Opcode = NVPTX::StoreParamI32_r;

    SDValue CvtNone = CurDAG->getTargetConstant(NVPTX::PTXCvtMode::NONE, DL,

                                                MVT::i32);

    SDNode *Cvt = CurDAG->getMachineNode(NVPTX::CVT_u32_u16, DL,

                                         MVT::i32, Ops[0], CvtNone);

    Ops[0] = SDValue(Cvt, 0);

    break;

  }

  case NVPTXISD::StoreParamS32: {

    Opcode = NVPTX::StoreParamI32_r;

    SDValue CvtNone = CurDAG->getTargetConstant(NVPTX::PTXCvtMode::NONE, DL,

                                                MVT::i32);

    SDNode *Cvt = CurDAG->getMachineNode(NVPTX::CVT_s32_s16, DL,

                                         MVT::i32, Ops[0], CvtNone);

    Ops[0] = SDValue(Cvt, 0);

    break;

  }

  }


  SDVTList RetVTs = CurDAG->getVTList(MVT::Other, MVT::Glue);

  SDNode *Ret = CurDAG->getMachineNode(*Opcode, DL, RetVTs, Ops);

  MachineMemOperand *MemRef = cast<MemSDNode>(N)->getMemOperand();

  CurDAG->setNodeMemRefs(cast<MachineSDNode>(Ret), {MemRef});


  ReplaceNode(N, Ret);

  return true;

}


bool NVPTXDAGToDAGISel::tryTextureIntrinsic(SDNode *N) {

  unsigned Opc = 0;


  switch (N->getOpcode()) {

  default: return false;

  case NVPTXISD::Tex1DFloatS32:

    Opc = NVPTX::TEX_1D_F32_S32_RR;

    break;

  case NVPTXISD::Tex1DFloatFloat:

    Opc = NVPTX::TEX_1D_F32_F32_RR;

    break;

  case NVPTXISD::Tex1DFloatFloatLevel:

    Opc = NVPTX::TEX_1D_F32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex1DFloatFloatGrad:

    Opc = NVPTX::TEX_1D_F32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex1DS32S32:

    Opc = NVPTX::TEX_1D_S32_S32_RR;

    break;

  case NVPTXISD::Tex1DS32Float:

    Opc = NVPTX::TEX_1D_S32_F32_RR;

    break;

  case NVPTXISD::Tex1DS32FloatLevel:

    Opc = NVPTX::TEX_1D_S32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex1DS32FloatGrad:

    Opc = NVPTX::TEX_1D_S32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex1DU32S32:

    Opc = NVPTX::TEX_1D_U32_S32_RR;

    break;

  case NVPTXISD::Tex1DU32Float:

    Opc = NVPTX::TEX_1D_U32_F32_RR;

    break;

  case NVPTXISD::Tex1DU32FloatLevel:

    Opc = NVPTX::TEX_1D_U32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex1DU32FloatGrad:

    Opc = NVPTX::TEX_1D_U32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex1DArrayFloatS32:

    Opc = NVPTX::TEX_1D_ARRAY_F32_S32_RR;

    break;

  case NVPTXISD::Tex1DArrayFloatFloat:

    Opc = NVPTX::TEX_1D_ARRAY_F32_F32_RR;

    break;

  case NVPTXISD::Tex1DArrayFloatFloatLevel:

    Opc = NVPTX::TEX_1D_ARRAY_F32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex1DArrayFloatFloatGrad:

    Opc = NVPTX::TEX_1D_ARRAY_F32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex1DArrayS32S32:

    Opc = NVPTX::TEX_1D_ARRAY_S32_S32_RR;

    break;

  case NVPTXISD::Tex1DArrayS32Float:

    Opc = NVPTX::TEX_1D_ARRAY_S32_F32_RR;

    break;

  case NVPTXISD::Tex1DArrayS32FloatLevel:

    Opc = NVPTX::TEX_1D_ARRAY_S32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex1DArrayS32FloatGrad:

    Opc = NVPTX::TEX_1D_ARRAY_S32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex1DArrayU32S32:

    Opc = NVPTX::TEX_1D_ARRAY_U32_S32_RR;

    break;

  case NVPTXISD::Tex1DArrayU32Float:

    Opc = NVPTX::TEX_1D_ARRAY_U32_F32_RR;

    break;

  case NVPTXISD::Tex1DArrayU32FloatLevel:

    Opc = NVPTX::TEX_1D_ARRAY_U32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex1DArrayU32FloatGrad:

    Opc = NVPTX::TEX_1D_ARRAY_U32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex2DFloatS32:

    Opc = NVPTX::TEX_2D_F32_S32_RR;

    break;

  case NVPTXISD::Tex2DFloatFloat:

    Opc = NVPTX::TEX_2D_F32_F32_RR;

    break;

  case NVPTXISD::Tex2DFloatFloatLevel:

    Opc = NVPTX::TEX_2D_F32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex2DFloatFloatGrad:

    Opc = NVPTX::TEX_2D_F32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex2DS32S32:

    Opc = NVPTX::TEX_2D_S32_S32_RR;

    break;

  case NVPTXISD::Tex2DS32Float:

    Opc = NVPTX::TEX_2D_S32_F32_RR;

    break;

  case NVPTXISD::Tex2DS32FloatLevel:

    Opc = NVPTX::TEX_2D_S32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex2DS32FloatGrad:

    Opc = NVPTX::TEX_2D_S32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex2DU32S32:

    Opc = NVPTX::TEX_2D_U32_S32_RR;

    break;

  case NVPTXISD::Tex2DU32Float:

    Opc = NVPTX::TEX_2D_U32_F32_RR;

    break;

  case NVPTXISD::Tex2DU32FloatLevel:

    Opc = NVPTX::TEX_2D_U32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex2DU32FloatGrad:

    Opc = NVPTX::TEX_2D_U32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex2DArrayFloatS32:

    Opc = NVPTX::TEX_2D_ARRAY_F32_S32_RR;

    break;

  case NVPTXISD::Tex2DArrayFloatFloat:

    Opc = NVPTX::TEX_2D_ARRAY_F32_F32_RR;

    break;

  case NVPTXISD::Tex2DArrayFloatFloatLevel:

    Opc = NVPTX::TEX_2D_ARRAY_F32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex2DArrayFloatFloatGrad:

    Opc = NVPTX::TEX_2D_ARRAY_F32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex2DArrayS32S32:

    Opc = NVPTX::TEX_2D_ARRAY_S32_S32_RR;

    break;

  case NVPTXISD::Tex2DArrayS32Float:

    Opc = NVPTX::TEX_2D_ARRAY_S32_F32_RR;

    break;

  case NVPTXISD::Tex2DArrayS32FloatLevel:

    Opc = NVPTX::TEX_2D_ARRAY_S32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex2DArrayS32FloatGrad:

    Opc = NVPTX::TEX_2D_ARRAY_S32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex2DArrayU32S32:

    Opc = NVPTX::TEX_2D_ARRAY_U32_S32_RR;

    break;

  case NVPTXISD::Tex2DArrayU32Float:

    Opc = NVPTX::TEX_2D_ARRAY_U32_F32_RR;

    break;

  case NVPTXISD::Tex2DArrayU32FloatLevel:

    Opc = NVPTX::TEX_2D_ARRAY_U32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex2DArrayU32FloatGrad:

    Opc = NVPTX::TEX_2D_ARRAY_U32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex3DFloatS32:

    Opc = NVPTX::TEX_3D_F32_S32_RR;

    break;

  case NVPTXISD::Tex3DFloatFloat:

    Opc = NVPTX::TEX_3D_F32_F32_RR;

    break;

  case NVPTXISD::Tex3DFloatFloatLevel:

    Opc = NVPTX::TEX_3D_F32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex3DFloatFloatGrad:

    Opc = NVPTX::TEX_3D_F32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex3DS32S32:

    Opc = NVPTX::TEX_3D_S32_S32_RR;

    break;

  case NVPTXISD::Tex3DS32Float:

    Opc = NVPTX::TEX_3D_S32_F32_RR;

    break;

  case NVPTXISD::Tex3DS32FloatLevel:

    Opc = NVPTX::TEX_3D_S32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex3DS32FloatGrad:

    Opc = NVPTX::TEX_3D_S32_F32_GRAD_RR;

    break;

  case NVPTXISD::Tex3DU32S32:

    Opc = NVPTX::TEX_3D_U32_S32_RR;

    break;

  case NVPTXISD::Tex3DU32Float:

    Opc = NVPTX::TEX_3D_U32_F32_RR;

    break;

  case NVPTXISD::Tex3DU32FloatLevel:

    Opc = NVPTX::TEX_3D_U32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tex3DU32FloatGrad:

    Opc = NVPTX::TEX_3D_U32_F32_GRAD_RR;

    break;

  case NVPTXISD::TexCubeFloatFloat:

    Opc = NVPTX::TEX_CUBE_F32_F32_RR;

    break;

  case NVPTXISD::TexCubeFloatFloatLevel:

    Opc = NVPTX::TEX_CUBE_F32_F32_LEVEL_RR;

    break;

  case NVPTXISD::TexCubeS32Float:

    Opc = NVPTX::TEX_CUBE_S32_F32_RR;

    break;

  case NVPTXISD::TexCubeS32FloatLevel:

    Opc = NVPTX::TEX_CUBE_S32_F32_LEVEL_RR;

    break;

  case NVPTXISD::TexCubeU32Float:

    Opc = NVPTX::TEX_CUBE_U32_F32_RR;

    break;

  case NVPTXISD::TexCubeU32FloatLevel:

    Opc = NVPTX::TEX_CUBE_U32_F32_LEVEL_RR;

    break;

  case NVPTXISD::TexCubeArrayFloatFloat:

    Opc = NVPTX::TEX_CUBE_ARRAY_F32_F32_RR;

    break;

  case NVPTXISD::TexCubeArrayFloatFloatLevel:

    Opc = NVPTX::TEX_CUBE_ARRAY_F32_F32_LEVEL_RR;

    break;

  case NVPTXISD::TexCubeArrayS32Float:

    Opc = NVPTX::TEX_CUBE_ARRAY_S32_F32_RR;

    break;

  case NVPTXISD::TexCubeArrayS32FloatLevel:

    Opc = NVPTX::TEX_CUBE_ARRAY_S32_F32_LEVEL_RR;

    break;

  case NVPTXISD::TexCubeArrayU32Float:

    Opc = NVPTX::TEX_CUBE_ARRAY_U32_F32_RR;

    break;

  case NVPTXISD::TexCubeArrayU32FloatLevel:

    Opc = NVPTX::TEX_CUBE_ARRAY_U32_F32_LEVEL_RR;

    break;

  case NVPTXISD::Tld4R2DFloatFloat:

    Opc = NVPTX::TLD4_R_2D_F32_F32_RR;

    break;

  case NVPTXISD::Tld4G2DFloatFloat:

    Opc = NVPTX::TLD4_G_2D_F32_F32_RR;

    break;

  case NVPTXISD::Tld4B2DFloatFloat:

    Opc = NVPTX::TLD4_B_2D_F32_F32_RR;

    break;

  case NVPTXISD::Tld4A2DFloatFloat:

    Opc = NVPTX::TLD4_A_2D_F32_F32_RR;

    break;

  case NVPTXISD::Tld4R2DS64Float:

    Opc = NVPTX::TLD4_R_2D_S32_F32_RR;

    break;

  case NVPTXISD::Tld4G2DS64Float:

    Opc = NVPTX::TLD4_G_2D_S32_F32_RR;

    break;

  case NVPTXISD::Tld4B2DS64Float:

    Opc = NVPTX::TLD4_B_2D_S32_F32_RR;

    break;

  case NVPTXISD::Tld4A2DS64Float:

    Opc = NVPTX::TLD4_A_2D_S32_F32_RR;

    break;

  case NVPTXISD::Tld4R2DU64Float:

    Opc = NVPTX::TLD4_R_2D_U32_F32_RR;

    break;

  case NVPTXISD::Tld4G2DU64Float:

    Opc = NVPTX::TLD4_G_2D_U32_F32_RR;

    break;

  case NVPTXISD::Tld4B2DU64Float:

    Opc = NVPTX::TLD4_B_2D_U32_F32_RR;

    break;

  case NVPTXISD::Tld4A2DU64Float:

    Opc = NVPTX::TLD4_A_2D_U32_F32_RR;

    break;

  case NVPTXISD::TexUnified1DFloatS32:

    Opc = NVPTX::TEX_UNIFIED_1D_F32_S32_R;

    break;

  case NVPTXISD::TexUnified1DFloatFloat:

    Opc = NVPTX::TEX_UNIFIED_1D_F32_F32_R;

    break;

  case NVPTXISD::TexUnified1DFloatFloatLevel:

    Opc = NVPTX::TEX_UNIFIED_1D_F32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified1DFloatFloatGrad:

    Opc = NVPTX::TEX_UNIFIED_1D_F32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified1DS32S32:

    Opc = NVPTX::TEX_UNIFIED_1D_S32_S32_R;

    break;

  case NVPTXISD::TexUnified1DS32Float:

    Opc = NVPTX::TEX_UNIFIED_1D_S32_F32_R;

    break;

  case NVPTXISD::TexUnified1DS32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_1D_S32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified1DS32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_1D_S32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified1DU32S32:

    Opc = NVPTX::TEX_UNIFIED_1D_U32_S32_R;

    break;

  case NVPTXISD::TexUnified1DU32Float:

    Opc = NVPTX::TEX_UNIFIED_1D_U32_F32_R;

    break;

  case NVPTXISD::TexUnified1DU32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_1D_U32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified1DU32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_1D_U32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified1DArrayFloatS32:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_S32_R;

    break;

  case NVPTXISD::TexUnified1DArrayFloatFloat:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_R;

    break;

  case NVPTXISD::TexUnified1DArrayFloatFloatLevel:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified1DArrayFloatFloatGrad:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_F32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified1DArrayS32S32:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_S32_R;

    break;

  case NVPTXISD::TexUnified1DArrayS32Float:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_R;

    break;

  case NVPTXISD::TexUnified1DArrayS32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified1DArrayS32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_S32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified1DArrayU32S32:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_S32_R;

    break;

  case NVPTXISD::TexUnified1DArrayU32Float:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_R;

    break;

  case NVPTXISD::TexUnified1DArrayU32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified1DArrayU32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_1D_ARRAY_U32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified2DFloatS32:

    Opc = NVPTX::TEX_UNIFIED_2D_F32_S32_R;

    break;

  case NVPTXISD::TexUnified2DFloatFloat:

    Opc = NVPTX::TEX_UNIFIED_2D_F32_F32_R;

    break;

  case NVPTXISD::TexUnified2DFloatFloatLevel:

    Opc = NVPTX::TEX_UNIFIED_2D_F32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified2DFloatFloatGrad:

    Opc = NVPTX::TEX_UNIFIED_2D_F32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified2DS32S32:

    Opc = NVPTX::TEX_UNIFIED_2D_S32_S32_R;

    break;

  case NVPTXISD::TexUnified2DS32Float:

    Opc = NVPTX::TEX_UNIFIED_2D_S32_F32_R;

    break;

  case NVPTXISD::TexUnified2DS32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_2D_S32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified2DS32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_2D_S32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified2DU32S32:

    Opc = NVPTX::TEX_UNIFIED_2D_U32_S32_R;

    break;

  case NVPTXISD::TexUnified2DU32Float:

    Opc = NVPTX::TEX_UNIFIED_2D_U32_F32_R;

    break;

  case NVPTXISD::TexUnified2DU32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_2D_U32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified2DU32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_2D_U32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified2DArrayFloatS32:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_S32_R;

    break;

  case NVPTXISD::TexUnified2DArrayFloatFloat:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_R;

    break;

  case NVPTXISD::TexUnified2DArrayFloatFloatLevel:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified2DArrayFloatFloatGrad:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_F32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified2DArrayS32S32:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_S32_R;

    break;

  case NVPTXISD::TexUnified2DArrayS32Float:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_R;

    break;

  case NVPTXISD::TexUnified2DArrayS32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified2DArrayS32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_S32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified2DArrayU32S32:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_S32_R;

    break;

  case NVPTXISD::TexUnified2DArrayU32Float:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_R;

    break;

  case NVPTXISD::TexUnified2DArrayU32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified2DArrayU32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_2D_ARRAY_U32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified3DFloatS32:

    Opc = NVPTX::TEX_UNIFIED_3D_F32_S32_R;

    break;

  case NVPTXISD::TexUnified3DFloatFloat:

    Opc = NVPTX::TEX_UNIFIED_3D_F32_F32_R;

    break;

  case NVPTXISD::TexUnified3DFloatFloatLevel:

    Opc = NVPTX::TEX_UNIFIED_3D_F32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified3DFloatFloatGrad:

    Opc = NVPTX::TEX_UNIFIED_3D_F32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified3DS32S32:

    Opc = NVPTX::TEX_UNIFIED_3D_S32_S32_R;

    break;

  case NVPTXISD::TexUnified3DS32Float:

    Opc = NVPTX::TEX_UNIFIED_3D_S32_F32_R;

    break;

  case NVPTXISD::TexUnified3DS32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_3D_S32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified3DS32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_3D_S32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnified3DU32S32:

    Opc = NVPTX::TEX_UNIFIED_3D_U32_S32_R;

    break;

  case NVPTXISD::TexUnified3DU32Float:

    Opc = NVPTX::TEX_UNIFIED_3D_U32_F32_R;

    break;

  case NVPTXISD::TexUnified3DU32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_3D_U32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnified3DU32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_3D_U32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnifiedCubeFloatFloat:

    Opc = NVPTX::TEX_UNIFIED_CUBE_F32_F32_R;

    break;

  case NVPTXISD::TexUnifiedCubeFloatFloatLevel:

    Opc = NVPTX::TEX_UNIFIED_CUBE_F32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnifiedCubeS32Float:

    Opc = NVPTX::TEX_UNIFIED_CUBE_S32_F32_R;

    break;

  case NVPTXISD::TexUnifiedCubeS32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_CUBE_S32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnifiedCubeU32Float:

    Opc = NVPTX::TEX_UNIFIED_CUBE_U32_F32_R;

    break;

  case NVPTXISD::TexUnifiedCubeU32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_CUBE_U32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayFloatFloat:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayFloatFloatLevel:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayS32Float:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayS32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_LEVEL_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayU32Float:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayU32FloatLevel:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_LEVEL_R;

    break;

  case NVPTXISD::Tld4UnifiedR2DFloatFloat:

    Opc = NVPTX::TLD4_UNIFIED_R_2D_F32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedG2DFloatFloat:

    Opc = NVPTX::TLD4_UNIFIED_G_2D_F32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedB2DFloatFloat:

    Opc = NVPTX::TLD4_UNIFIED_B_2D_F32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedA2DFloatFloat:

    Opc = NVPTX::TLD4_UNIFIED_A_2D_F32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedR2DS64Float:

    Opc = NVPTX::TLD4_UNIFIED_R_2D_S32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedG2DS64Float:

    Opc = NVPTX::TLD4_UNIFIED_G_2D_S32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedB2DS64Float:

    Opc = NVPTX::TLD4_UNIFIED_B_2D_S32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedA2DS64Float:

    Opc = NVPTX::TLD4_UNIFIED_A_2D_S32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedR2DU64Float:

    Opc = NVPTX::TLD4_UNIFIED_R_2D_U32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedG2DU64Float:

    Opc = NVPTX::TLD4_UNIFIED_G_2D_U32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedB2DU64Float:

    Opc = NVPTX::TLD4_UNIFIED_B_2D_U32_F32_R;

    break;

  case NVPTXISD::Tld4UnifiedA2DU64Float:

    Opc = NVPTX::TLD4_UNIFIED_A_2D_U32_F32_R;

    break;

  case NVPTXISD::TexUnifiedCubeFloatFloatGrad:

    Opc = NVPTX::TEX_UNIFIED_CUBE_F32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnifiedCubeS32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_CUBE_S32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnifiedCubeU32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_CUBE_U32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayFloatFloatGrad:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_F32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayS32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_S32_F32_GRAD_R;

    break;

  case NVPTXISD::TexUnifiedCubeArrayU32FloatGrad:

    Opc = NVPTX::TEX_UNIFIED_CUBE_ARRAY_U32_F32_GRAD_R;

    break;

  }


  // Copy over operands

  SmallVector<SDValue, 8> Ops(drop_begin(N->ops()));

  Ops.push_back(N->getOperand(0)); // Move chain to the back.


  ReplaceNode(N, CurDAG->getMachineNode(Opc, SDLoc(N), N->getVTList(), Ops));

  return true;

}


bool NVPTXDAGToDAGISel::trySurfaceIntrinsic(SDNode *N) {

  unsigned Opc = 0;

  switch (N->getOpcode()) {

  default: return false;

  case NVPTXISD::Suld1DI8Clamp:

    Opc = NVPTX::SULD_1D_I8_CLAMP_R;

    break;

  case NVPTXISD::Suld1DI16Clamp:

    Opc = NVPTX::SULD_1D_I16_CLAMP_R;

    break;

  case NVPTXISD::Suld1DI32Clamp:

    Opc = NVPTX::SULD_1D_I32_CLAMP_R;

    break;

  case NVPTXISD::Suld1DI64Clamp:

    Opc = NVPTX::SULD_1D_I64_CLAMP_R;

    break;

  case NVPTXISD::Suld1DV2I8Clamp:

    Opc = NVPTX::SULD_1D_V2I8_CLAMP_R;

    break;

  case NVPTXISD::Suld1DV2I16Clamp:

    Opc = NVPTX::SULD_1D_V2I16_CLAMP_R;

    break;

  case NVPTXISD::Suld1DV2I32Clamp:

    Opc = NVPTX::SULD_1D_V2I32_CLAMP_R;

    break;

  case NVPTXISD::Suld1DV2I64Clamp:

    Opc = NVPTX::SULD_1D_V2I64_CLAMP_R;

    break;

  case NVPTXISD::Suld1DV4I8Clamp:

    Opc = NVPTX::SULD_1D_V4I8_CLAMP_R;

    break;

  case NVPTXISD::Suld1DV4I16Clamp:

    Opc = NVPTX::SULD_1D_V4I16_CLAMP_R;

    break;

  case NVPTXISD::Suld1DV4I32Clamp:

    Opc = NVPTX::SULD_1D_V4I32_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayI8Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_I8_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayI16Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_I16_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayI32Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_I32_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayI64Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_I64_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayV2I8Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_V2I8_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayV2I16Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_V2I16_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayV2I32Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_V2I32_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayV2I64Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_V2I64_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayV4I8Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_V4I8_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayV4I16Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_V4I16_CLAMP_R;

    break;

  case NVPTXISD::Suld1DArrayV4I32Clamp:

    Opc = NVPTX::SULD_1D_ARRAY_V4I32_CLAMP_R;

    break;

  case NVPTXISD::Suld2DI8Clamp:

    Opc = NVPTX::SULD_2D_I8_CLAMP_R;

    break;

  case NVPTXISD::Suld2DI16Clamp:

    Opc = NVPTX::SULD_2D_I16_CLAMP_R;

    break;

  case NVPTXISD::Suld2DI32Clamp:

    Opc = NVPTX::SULD_2D_I32_CLAMP_R;

    break;

  case NVPTXISD::Suld2DI64Clamp:

    Opc = NVPTX::SULD_2D_I64_CLAMP_R;

    break;

  case NVPTXISD::Suld2DV2I8Clamp:

    Opc = NVPTX::SULD_2D_V2I8_CLAMP_R;

    break;

  case NVPTXISD::Suld2DV2I16Clamp:

    Opc = NVPTX::SULD_2D_V2I16_CLAMP_R;

    break;

  case NVPTXISD::Suld2DV2I32Clamp:

    Opc = NVPTX::SULD_2D_V2I32_CLAMP_R;

    break;

  case NVPTXISD::Suld2DV2I64Clamp:

    Opc = NVPTX::SULD_2D_V2I64_CLAMP_R;

    break;

  case NVPTXISD::Suld2DV4I8Clamp:

    Opc = NVPTX::SULD_2D_V4I8_CLAMP_R;

    break;

  case NVPTXISD::Suld2DV4I16Clamp:

    Opc = NVPTX::SULD_2D_V4I16_CLAMP_R;

    break;

  case NVPTXISD::Suld2DV4I32Clamp:

    Opc = NVPTX::SULD_2D_V4I32_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayI8Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_I8_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayI16Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_I16_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayI32Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_I32_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayI64Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_I64_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayV2I8Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_V2I8_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayV2I16Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_V2I16_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayV2I32Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_V2I32_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayV2I64Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_V2I64_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayV4I8Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_V4I8_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayV4I16Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_V4I16_CLAMP_R;

    break;

  case NVPTXISD::Suld2DArrayV4I32Clamp:

    Opc = NVPTX::SULD_2D_ARRAY_V4I32_CLAMP_R;

    break;

  case NVPTXISD::Suld3DI8Clamp:

    Opc = NVPTX::SULD_3D_I8_CLAMP_R;

    break;

  case NVPTXISD::Suld3DI16Clamp:

    Opc = NVPTX::SULD_3D_I16_CLAMP_R;

    break;

  case NVPTXISD::Suld3DI32Clamp:

    Opc = NVPTX::SULD_3D_I32_CLAMP_R;

    break;

  case NVPTXISD::Suld3DI64Clamp:

    Opc = NVPTX::SULD_3D_I64_CLAMP_R;

    break;

  case NVPTXISD::Suld3DV2I8Clamp:

    Opc = NVPTX::SULD_3D_V2I8_CLAMP_R;

    break;

  case NVPTXISD::Suld3DV2I16Clamp:

    Opc = NVPTX::SULD_3D_V2I16_CLAMP_R;

    break;

  case NVPTXISD::Suld3DV2I32Clamp:

    Opc = NVPTX::SULD_3D_V2I32_CLAMP_R;

    break;

  case NVPTXISD::Suld3DV2I64Clamp:

    Opc = NVPTX::SULD_3D_V2I64_CLAMP_R;

    break;

  case NVPTXISD::Suld3DV4I8Clamp:

    Opc = NVPTX::SULD_3D_V4I8_CLAMP_R;

    break;

  case NVPTXISD::Suld3DV4I16Clamp:

    Opc = NVPTX::SULD_3D_V4I16_CLAMP_R;

    break;

  case NVPTXISD::Suld3DV4I32Clamp:

    Opc = NVPTX::SULD_3D_V4I32_CLAMP_R;

    break;

  case NVPTXISD::Suld1DI8Trap:

    Opc = NVPTX::SULD_1D_I8_TRAP_R;

    break;

  case NVPTXISD::Suld1DI16Trap:

    Opc = NVPTX::SULD_1D_I16_TRAP_R;

    break;

  case NVPTXISD::Suld1DI32Trap:

    Opc = NVPTX::SULD_1D_I32_TRAP_R;

    break;

  case NVPTXISD::Suld1DI64Trap:

    Opc = NVPTX::SULD_1D_I64_TRAP_R;

    break;

  case NVPTXISD::Suld1DV2I8Trap:

    Opc = NVPTX::SULD_1D_V2I8_TRAP_R;

    break;

  case NVPTXISD::Suld1DV2I16Trap:

    Opc = NVPTX::SULD_1D_V2I16_TRAP_R;

    break;

  case NVPTXISD::Suld1DV2I32Trap:

    Opc = NVPTX::SULD_1D_V2I32_TRAP_R;

    break;

  case NVPTXISD::Suld1DV2I64Trap:

    Opc = NVPTX::SULD_1D_V2I64_TRAP_R;

    break;

  case NVPTXISD::Suld1DV4I8Trap:

    Opc = NVPTX::SULD_1D_V4I8_TRAP_R;

    break;

  case NVPTXISD::Suld1DV4I16Trap:

    Opc = NVPTX::SULD_1D_V4I16_TRAP_R;

    break;

  case NVPTXISD::Suld1DV4I32Trap:

    Opc = NVPTX::SULD_1D_V4I32_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayI8Trap:

    Opc = NVPTX::SULD_1D_ARRAY_I8_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayI16Trap:

    Opc = NVPTX::SULD_1D_ARRAY_I16_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayI32Trap:

    Opc = NVPTX::SULD_1D_ARRAY_I32_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayI64Trap:

    Opc = NVPTX::SULD_1D_ARRAY_I64_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayV2I8Trap:

    Opc = NVPTX::SULD_1D_ARRAY_V2I8_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayV2I16Trap:

    Opc = NVPTX::SULD_1D_ARRAY_V2I16_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayV2I32Trap:

    Opc = NVPTX::SULD_1D_ARRAY_V2I32_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayV2I64Trap:

    Opc = NVPTX::SULD_1D_ARRAY_V2I64_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayV4I8Trap:

    Opc = NVPTX::SULD_1D_ARRAY_V4I8_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayV4I16Trap:

    Opc = NVPTX::SULD_1D_ARRAY_V4I16_TRAP_R;

    break;

  case NVPTXISD::Suld1DArrayV4I32Trap:

    Opc = NVPTX::SULD_1D_ARRAY_V4I32_TRAP_R;

    break;

  case NVPTXISD::Suld2DI8Trap:

    Opc = NVPTX::SULD_2D_I8_TRAP_R;

    break;

  case NVPTXISD::Suld2DI16Trap:

    Opc = NVPTX::SULD_2D_I16_TRAP_R;

    break;

  case NVPTXISD::Suld2DI32Trap:

    Opc = NVPTX::SULD_2D_I32_TRAP_R;

    break;

  case NVPTXISD::Suld2DI64Trap:

    Opc = NVPTX::SULD_2D_I64_TRAP_R;

    break;

  case NVPTXISD::Suld2DV2I8Trap:

    Opc = NVPTX::SULD_2D_V2I8_TRAP_R;

    break;

  case NVPTXISD::Suld2DV2I16Trap:

    Opc = NVPTX::SULD_2D_V2I16_TRAP_R;

    break;

  case NVPTXISD::Suld2DV2I32Trap:

    Opc = NVPTX::SULD_2D_V2I32_TRAP_R;

    break;

  case NVPTXISD::Suld2DV2I64Trap:

    Opc = NVPTX::SULD_2D_V2I64_TRAP_R;

    break;

  case NVPTXISD::Suld2DV4I8Trap:

    Opc = NVPTX::SULD_2D_V4I8_TRAP_R;

    break;

  case NVPTXISD::Suld2DV4I16Trap:

    Opc = NVPTX::SULD_2D_V4I16_TRAP_R;

    break;

  case NVPTXISD::Suld2DV4I32Trap:

    Opc = NVPTX::SULD_2D_V4I32_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayI8Trap:

    Opc = NVPTX::SULD_2D_ARRAY_I8_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayI16Trap:

    Opc = NVPTX::SULD_2D_ARRAY_I16_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayI32Trap:

    Opc = NVPTX::SULD_2D_ARRAY_I32_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayI64Trap:

    Opc = NVPTX::SULD_2D_ARRAY_I64_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayV2I8Trap:

    Opc = NVPTX::SULD_2D_ARRAY_V2I8_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayV2I16Trap:

    Opc = NVPTX::SULD_2D_ARRAY_V2I16_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayV2I32Trap:

    Opc = NVPTX::SULD_2D_ARRAY_V2I32_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayV2I64Trap:

    Opc = NVPTX::SULD_2D_ARRAY_V2I64_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayV4I8Trap:

    Opc = NVPTX::SULD_2D_ARRAY_V4I8_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayV4I16Trap:

    Opc = NVPTX::SULD_2D_ARRAY_V4I16_TRAP_R;

    break;

  case NVPTXISD::Suld2DArrayV4I32Trap:

    Opc = NVPTX::SULD_2D_ARRAY_V4I32_TRAP_R;

    break;

  case NVPTXISD::Suld3DI8Trap:

    Opc = NVPTX::SULD_3D_I8_TRAP_R;

    break;

  case NVPTXISD::Suld3DI16Trap:

    Opc = NVPTX::SULD_3D_I16_TRAP_R;

    break;

  case NVPTXISD::Suld3DI32Trap:

    Opc = NVPTX::SULD_3D_I32_TRAP_R;

    break;

  case NVPTXISD::Suld3DI64Trap:

    Opc = NVPTX::SULD_3D_I64_TRAP_R;

    break;

  case NVPTXISD::Suld3DV2I8Trap:

    Opc = NVPTX::SULD_3D_V2I8_TRAP_R;

    break;

  case NVPTXISD::Suld3DV2I16Trap:

    Opc = NVPTX::SULD_3D_V2I16_TRAP_R;

    break;

  case NVPTXISD::Suld3DV2I32Trap:

    Opc = NVPTX::SULD_3D_V2I32_TRAP_R;

    break;

  case NVPTXISD::Suld3DV2I64Trap:

    Opc = NVPTX::SULD_3D_V2I64_TRAP_R;

    break;

  case NVPTXISD::Suld3DV4I8Trap:

    Opc = NVPTX::SULD_3D_V4I8_TRAP_R;

    break;

  case NVPTXISD::Suld3DV4I16Trap:

    Opc = NVPTX::SULD_3D_V4I16_TRAP_R;

    break;

  case NVPTXISD::Suld3DV4I32Trap:

    Opc = NVPTX::SULD_3D_V4I32_TRAP_R;

    break;

  case NVPTXISD::Suld1DI8Zero:

    Opc = NVPTX::SULD_1D_I8_ZERO_R;

    break;

  case NVPTXISD::Suld1DI16Zero:

    Opc = NVPTX::SULD_1D_I16_ZERO_R;

    break;

  case NVPTXISD::Suld1DI32Zero:

    Opc = NVPTX::SULD_1D_I32_ZERO_R;

    break;

  case NVPTXISD::Suld1DI64Zero:

    Opc = NVPTX::SULD_1D_I64_ZERO_R;

    break;

  case NVPTXISD::Suld1DV2I8Zero:

    Opc = NVPTX::SULD_1D_V2I8_ZERO_R;

    break;

  case NVPTXISD::Suld1DV2I16Zero:

    Opc = NVPTX::SULD_1D_V2I16_ZERO_R;

    break;

  case NVPTXISD::Suld1DV2I32Zero:

    Opc = NVPTX::SULD_1D_V2I32_ZERO_R;

    break;

  case NVPTXISD::Suld1DV2I64Zero:

    Opc = NVPTX::SULD_1D_V2I64_ZERO_R;

    break;

  case NVPTXISD::Suld1DV4I8Zero:

    Opc = NVPTX::SULD_1D_V4I8_ZERO_R;

    break;

  case NVPTXISD::Suld1DV4I16Zero:

    Opc = NVPTX::SULD_1D_V4I16_ZERO_R;

    break;

  case NVPTXISD::Suld1DV4I32Zero:

    Opc = NVPTX::SULD_1D_V4I32_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayI8Zero:

    Opc = NVPTX::SULD_1D_ARRAY_I8_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayI16Zero:

    Opc = NVPTX::SULD_1D_ARRAY_I16_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayI32Zero:

    Opc = NVPTX::SULD_1D_ARRAY_I32_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayI64Zero:

    Opc = NVPTX::SULD_1D_ARRAY_I64_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayV2I8Zero:

    Opc = NVPTX::SULD_1D_ARRAY_V2I8_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayV2I16Zero:

    Opc = NVPTX::SULD_1D_ARRAY_V2I16_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayV2I32Zero:

    Opc = NVPTX::SULD_1D_ARRAY_V2I32_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayV2I64Zero:

    Opc = NVPTX::SULD_1D_ARRAY_V2I64_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayV4I8Zero:

    Opc = NVPTX::SULD_1D_ARRAY_V4I8_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayV4I16Zero:

    Opc = NVPTX::SULD_1D_ARRAY_V4I16_ZERO_R;

    break;

  case NVPTXISD::Suld1DArrayV4I32Zero:

    Opc = NVPTX::SULD_1D_ARRAY_V4I32_ZERO_R;

    break;

  case NVPTXISD::Suld2DI8Zero:

    Opc = NVPTX::SULD_2D_I8_ZERO_R;

    break;

  case NVPTXISD::Suld2DI16Zero:

    Opc = NVPTX::SULD_2D_I16_ZERO_R;

    break;

  case NVPTXISD::Suld2DI32Zero:

    Opc = NVPTX::SULD_2D_I32_ZERO_R;

    break;

  case NVPTXISD::Suld2DI64Zero:

    Opc = NVPTX::SULD_2D_I64_ZERO_R;

    break;

  case NVPTXISD::Suld2DV2I8Zero:

    Opc = NVPTX::SULD_2D_V2I8_ZERO_R;

    break;

  case NVPTXISD::Suld2DV2I16Zero:

    Opc = NVPTX::SULD_2D_V2I16_ZERO_R;

    break;

  case NVPTXISD::Suld2DV2I32Zero:

    Opc = NVPTX::SULD_2D_V2I32_ZERO_R;

    break;

  case NVPTXISD::Suld2DV2I64Zero:

    Opc = NVPTX::SULD_2D_V2I64_ZERO_R;

    break;

  case NVPTXISD::Suld2DV4I8Zero:

    Opc = NVPTX::SULD_2D_V4I8_ZERO_R;

    break;

  case NVPTXISD::Suld2DV4I16Zero:

    Opc = NVPTX::SULD_2D_V4I16_ZERO_R;

    break;

  case NVPTXISD::Suld2DV4I32Zero:

    Opc = NVPTX::SULD_2D_V4I32_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayI8Zero:

    Opc = NVPTX::SULD_2D_ARRAY_I8_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayI16Zero:

    Opc = NVPTX::SULD_2D_ARRAY_I16_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayI32Zero:

    Opc = NVPTX::SULD_2D_ARRAY_I32_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayI64Zero:

    Opc = NVPTX::SULD_2D_ARRAY_I64_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayV2I8Zero:

    Opc = NVPTX::SULD_2D_ARRAY_V2I8_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayV2I16Zero:

    Opc = NVPTX::SULD_2D_ARRAY_V2I16_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayV2I32Zero:

    Opc = NVPTX::SULD_2D_ARRAY_V2I32_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayV2I64Zero:

    Opc = NVPTX::SULD_2D_ARRAY_V2I64_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayV4I8Zero:

    Opc = NVPTX::SULD_2D_ARRAY_V4I8_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayV4I16Zero:

    Opc = NVPTX::SULD_2D_ARRAY_V4I16_ZERO_R;

    break;

  case NVPTXISD::Suld2DArrayV4I32Zero:

    Opc = NVPTX::SULD_2D_ARRAY_V4I32_ZERO_R;

    break;

  case NVPTXISD::Suld3DI8Zero:

    Opc = NVPTX::SULD_3D_I8_ZERO_R;

    break;

  case NVPTXISD::Suld3DI16Zero:

    Opc = NVPTX::SULD_3D_I16_ZERO_R;

    break;

  case NVPTXISD::Suld3DI32Zero:

    Opc = NVPTX::SULD_3D_I32_ZERO_R;

    break;

  case NVPTXISD::Suld3DI64Zero:

    Opc = NVPTX::SULD_3D_I64_ZERO_R;

    break;

  case NVPTXISD::Suld3DV2I8Zero:

    Opc = NVPTX::SULD_3D_V2I8_ZERO_R;

    break;

  case NVPTXISD::Suld3DV2I16Zero:

    Opc = NVPTX::SULD_3D_V2I16_ZERO_R;

    break;

  case NVPTXISD::Suld3DV2I32Zero:

    Opc = NVPTX::SULD_3D_V2I32_ZERO_R;

    break;

  case NVPTXISD::Suld3DV2I64Zero:

    Opc = NVPTX::SULD_3D_V2I64_ZERO_R;

    break;

  case NVPTXISD::Suld3DV4I8Zero:

    Opc = NVPTX::SULD_3D_V4I8_ZERO_R;

    break;

  case NVPTXISD::Suld3DV4I16Zero:

    Opc = NVPTX::SULD_3D_V4I16_ZERO_R;

    break;

  case NVPTXISD::Suld3DV4I32Zero:

    Opc = NVPTX::SULD_3D_V4I32_ZERO_R;

    break;

  }


  // Copy over operands

  SmallVector<SDValue, 8> Ops(drop_begin(N->ops()));

  Ops.push_back(N->getOperand(0)); // Move chain to the back.


  ReplaceNode(N, CurDAG->getMachineNode(Opc, SDLoc(N), N->getVTList(), Ops));

  return true;

}


/// SelectBFE - Look for instruction sequences that can be made more efficient

/// by using the 'bfe' (bit-field extract) PTX instruction

bool NVPTXDAGToDAGISel::tryBFE(SDNode *N) {

  SDLoc DL(N);

  SDValue LHS = N->getOperand(0);

  SDValue RHS = N->getOperand(1);

  SDValue Len;

  SDValue Start;

  SDValue Val;

  bool IsSigned = false;


  if (N->getOpcode() == ISD::AND) {

    // Canonicalize the operands

    // We want 'and %val, %mask'

    if (isa<ConstantSDNode>(LHS) && !isa<ConstantSDNode>(RHS)) {

      std::swap(LHS, RHS);

    }


    ConstantSDNode *Mask = dyn_cast<ConstantSDNode>(RHS);

    if (!Mask) {

      // We need a constant mask on the RHS of the AND

      return false;

    }


    // Extract the mask bits

    uint64_t MaskVal = Mask->getZExtValue();

    if (!isMask_64(MaskVal)) {

      // We *could* handle shifted masks here, but doing so would require an

      // 'and' operation to fix up the low-order bits so we would trade

      // shr+and for bfe+and, which has the same throughput

      return false;

    }


    // How many bits are in our mask?

    int64_t NumBits = countr_one(MaskVal);

    Len = CurDAG->getTargetConstant(NumBits, DL, MVT::i32);


    if (LHS.getOpcode() == ISD::SRL || LHS.getOpcode() == ISD::SRA) {

      // We have a 'srl/and' pair, extract the effective start bit and length

      Val = LHS.getNode()->getOperand(0);

      Start = LHS.getNode()->getOperand(1);

      ConstantSDNode *StartConst = dyn_cast<ConstantSDNode>(Start);

      if (StartConst) {

        uint64_t StartVal = StartConst->getZExtValue();

        // How many "good" bits do we have left?  "good" is defined here as bits

        // that exist in the original value, not shifted in.

        int64_t GoodBits = Start.getValueSizeInBits() - StartVal;

        if (NumBits > GoodBits) {

          // Do not handle the case where bits have been shifted in. In theory

          // we could handle this, but the cost is likely higher than just

          // emitting the srl/and pair.

          return false;

        }

        Start = CurDAG->getTargetConstant(StartVal, DL, MVT::i32);

      } else {

        // Do not handle the case where the shift amount (can be zero if no srl

        // was found) is not constant. We could handle this case, but it would

        // require run-time logic that would be more expensive than just

        // emitting the srl/and pair.

        return false;

      }

    } else {

      // Do not handle the case where the LHS of the and is not a shift. While

      // it would be trivial to handle this case, it would just transform

      // 'and' -> 'bfe', but 'and' has higher-throughput.

      return false;

    }

  } else if (N->getOpcode() == ISD::SRL || N->getOpcode() == ISD::SRA) {

    if (LHS->getOpcode() == ISD::AND) {

      ConstantSDNode *ShiftCnst = dyn_cast<ConstantSDNode>(RHS);

      if (!ShiftCnst) {

        // Shift amount must be constant

        return false;

      }


      uint64_t ShiftAmt = ShiftCnst->getZExtValue();


      SDValue AndLHS = LHS->getOperand(0);

      SDValue AndRHS = LHS->getOperand(1);


      // Canonicalize the AND to have the mask on the RHS

      if (isa<ConstantSDNode>(AndLHS)) {

        std::swap(AndLHS, AndRHS);

      }


      ConstantSDNode *MaskCnst = dyn_cast<ConstantSDNode>(AndRHS);

      if (!MaskCnst) {

        // Mask must be constant

        return false;

      }


      uint64_t MaskVal = MaskCnst->getZExtValue();

      uint64_t NumZeros;

      uint64_t NumBits;

      if (isMask_64(MaskVal)) {

        NumZeros = 0;

        // The number of bits in the result bitfield will be the number of

        // trailing ones (the AND) minus the number of bits we shift off

        NumBits = llvm::countr_one(MaskVal) - ShiftAmt;

      } else if (isShiftedMask_64(MaskVal)) {

        NumZeros = llvm::countr_zero(MaskVal);

        unsigned NumOnes = llvm::countr_one(MaskVal >> NumZeros);

        // The number of bits in the result bitfield will be the number of

        // trailing zeros plus the number of set bits in the mask minus the

        // number of bits we shift off

        NumBits = NumZeros + NumOnes - ShiftAmt;

      } else {

        // This is not a mask we can handle

        return false;

      }


      if (ShiftAmt < NumZeros) {

        // Handling this case would require extra logic that would make this

        // transformation non-profitable

        return false;

      }


      Val = AndLHS;

      Start = CurDAG->getTargetConstant(ShiftAmt, DL, MVT::i32);

      Len = CurDAG->getTargetConstant(NumBits, DL, MVT::i32);

    } else if (LHS->getOpcode() == ISD::SHL) {

      // Here, we have a pattern like:

      //

      // (sra (shl val, NN), MM)

      // or

      // (srl (shl val, NN), MM)

      //

      // If MM >= NN, we can efficiently optimize this with bfe

      Val = LHS->getOperand(0);


      SDValue ShlRHS = LHS->getOperand(1);

      ConstantSDNode *ShlCnst = dyn_cast<ConstantSDNode>(ShlRHS);

      if (!ShlCnst) {

        // Shift amount must be constant

        return false;

      }

      uint64_t InnerShiftAmt = ShlCnst->getZExtValue();


      SDValue ShrRHS = RHS;

      ConstantSDNode *ShrCnst = dyn_cast<ConstantSDNode>(ShrRHS);

      if (!ShrCnst) {

        // Shift amount must be constant

        return false;

      }

      uint64_t OuterShiftAmt = ShrCnst->getZExtValue();


      // To avoid extra codegen and be profitable, we need Outer >= Inner

      if (OuterShiftAmt < InnerShiftAmt) {

        return false;

      }


      // If the outer shift is more than the type size, we have no bitfield to

      // extract (since we also check that the inner shift is <= the outer shift

      // then this also implies that the inner shift is < the type size)

      if (OuterShiftAmt >= Val.getValueSizeInBits()) {

        return false;

      }


      Start = CurDAG->getTargetConstant(OuterShiftAmt - InnerShiftAmt, DL,

                                        MVT::i32);

      Len = CurDAG->getTargetConstant(Val.getValueSizeInBits() - OuterShiftAmt,

                                      DL, MVT::i32);


      if (N->getOpcode() == ISD::SRA) {

        // If we have a arithmetic right shift, we need to use the signed bfe

        // variant

        IsSigned = true;

      }

    } else {

      // No can do...

      return false;

    }

  } else {

    // No can do...

    return false;

  }


  unsigned Opc;

  // For the BFE operations we form here from "and" and "srl", always use the

  // unsigned variants.

  if (Val.getValueType() == MVT::i32) {

    if (IsSigned) {

      Opc = NVPTX::BFE_S32rii;

    } else {

      Opc = NVPTX::BFE_U32rii;

    }

  } else if (Val.getValueType() == MVT::i64) {

    if (IsSigned) {

      Opc = NVPTX::BFE_S64rii;

    } else {

      Opc = NVPTX::BFE_U64rii;

    }

  } else {

    // We cannot handle this type

    return false;

  }


  SDValue Ops[] = {

    Val, Start, Len

  };


  ReplaceNode(N, CurDAG->getMachineNode(Opc, DL, N->getVTList(), Ops));

  return true;

}


// SelectDirectAddr - Match a direct address for DAG.

// A direct address could be a globaladdress or externalsymbol.

bool NVPTXDAGToDAGISel::SelectDirectAddr(SDValue N, SDValue &Address) {

  // Return true if TGA or ES.

  if (N.getOpcode() == ISD::TargetGlobalAddress ||

      N.getOpcode() == ISD::TargetExternalSymbol) {

    Address = N;

    return true;

  }

  if (N.getOpcode() == NVPTXISD::Wrapper) {

    Address = N.getOperand(0);

    return true;

  }

  // addrspacecast(MoveParam(arg_symbol) to addrspace(PARAM)) -> arg_symbol

  if (AddrSpaceCastSDNode *CastN = dyn_cast<AddrSpaceCastSDNode>(N)) {

    if (CastN->getSrcAddressSpace() == ADDRESS_SPACE_GENERIC &&

        CastN->getDestAddressSpace() == ADDRESS_SPACE_PARAM &&

        CastN->getOperand(0).getOpcode() == NVPTXISD::MoveParam)

      return SelectDirectAddr(CastN->getOperand(0).getOperand(0), Address);

  }

  return false;

}


// symbol+offset

bool NVPTXDAGToDAGISel::SelectADDRsi_imp(

    SDNode *OpNode, SDValue Addr, SDValue &Base, SDValue &Offset, MVT mvt) {

  if (Addr.getOpcode() == ISD::ADD) {

    if (ConstantSDNode *CN = dyn_cast<ConstantSDNode>(Addr.getOperand(1))) {

      SDValue base = Addr.getOperand(0);

      if (SelectDirectAddr(base, Base)) {

        Offset = CurDAG->getTargetConstant(CN->getZExtValue(), SDLoc(OpNode),

                                           mvt);

        return true;

      }

    }

  }

  return false;

}


// symbol+offset

bool NVPTXDAGToDAGISel::SelectADDRsi(SDNode *OpNode, SDValue Addr,

                                     SDValue &Base, SDValue &Offset) {

  return SelectADDRsi_imp(OpNode, Addr, Base, Offset, MVT::i32);

}


// symbol+offset

bool NVPTXDAGToDAGISel::SelectADDRsi64(SDNode *OpNode, SDValue Addr,

                                       SDValue &Base, SDValue &Offset) {

  return SelectADDRsi_imp(OpNode, Addr, Base, Offset, MVT::i64);

}


// register+offset

bool NVPTXDAGToDAGISel::SelectADDRri_imp(

    SDNode *OpNode, SDValue Addr, SDValue &Base, SDValue &Offset, MVT mvt) {

  if (FrameIndexSDNode *FIN = dyn_cast<FrameIndexSDNode>(Addr)) {

    Base = CurDAG->getTargetFrameIndex(FIN->getIndex(), mvt);

    Offset = CurDAG->getTargetConstant(0, SDLoc(OpNode), mvt);

    return true;

  }

  if (Addr.getOpcode() == ISD::TargetExternalSymbol ||

      Addr.getOpcode() == ISD::TargetGlobalAddress)

    return false; // direct calls.


  if (Addr.getOpcode() == ISD::ADD) {

    if (SelectDirectAddr(Addr.getOperand(0), Addr)) {

      return false;

    }

    if (ConstantSDNode *CN = dyn_cast<ConstantSDNode>(Addr.getOperand(1))) {

      if (FrameIndexSDNode *FIN =

              dyn_cast<FrameIndexSDNode>(Addr.getOperand(0)))

        // Constant offset from frame ref.

        Base = CurDAG->getTargetFrameIndex(FIN->getIndex(), mvt);

      else

        Base = Addr.getOperand(0);

      Offset = CurDAG->getTargetConstant(CN->getZExtValue(), SDLoc(OpNode),

                                         mvt);

      return true;

    }

  }

  return false;

}


// register+offset

bool NVPTXDAGToDAGISel::SelectADDRri(SDNode *OpNode, SDValue Addr,

                                     SDValue &Base, SDValue &Offset) {

  return SelectADDRri_imp(OpNode, Addr, Base, Offset, MVT::i32);

}


// register+offset

bool NVPTXDAGToDAGISel::SelectADDRri64(SDNode *OpNode, SDValue Addr,

                                       SDValue &Base, SDValue &Offset) {

  return SelectADDRri_imp(OpNode, Addr, Base, Offset, MVT::i64);

}


bool NVPTXDAGToDAGISel::ChkMemSDNodeAddressSpace(SDNode *N,

                                                 unsigned int spN) const {

  const Value *Src = nullptr;

  if (MemSDNode *mN = dyn_cast<MemSDNode>(N)) {

    if (spN == 0 && mN->getMemOperand()->getPseudoValue())

      return true;

    Src = mN->getMemOperand()->getValue();

  }

  if (!Src)

    return false;

  if (auto *PT = dyn_cast<PointerType>(Src->getType()))

    return (PT->getAddressSpace() == spN);

  return false;

}


/// SelectInlineAsmMemoryOperand - Implement addressing mode selection for

/// inline asm expressions.

bool NVPTXDAGToDAGISel::SelectInlineAsmMemoryOperand(

    const SDValue &Op, InlineAsm::ConstraintCode ConstraintID,

    std::vector<SDValue> &OutOps) {

  SDValue Op0, Op1;

  switch (ConstraintID) {

  default:

    return true;

  case InlineAsm::ConstraintCode::m: // memory

    if (SelectDirectAddr(Op, Op0)) {

      OutOps.push_back(Op0);

      OutOps.push_back(CurDAG->getTargetConstant(0, SDLoc(Op), MVT::i32));

      return false;

    }

    if (SelectADDRri(Op.getNode(), Op, Op0, Op1)) {

      OutOps.push_back(Op0);

      OutOps.push_back(Op1);

      return false;

    }

    break;

  }

  return true;

}


/// GetConvertOpcode - Returns the CVT_ instruction opcode that implements a

/// conversion from \p SrcTy to \p DestTy.

unsigned NVPTXDAGToDAGISel::GetConvertOpcode(MVT DestTy, MVT SrcTy,

                                             LoadSDNode *LdNode) {

  bool IsSigned = LdNode && LdNode->getExtensionType() == ISD::SEXTLOAD;

  switch (SrcTy.SimpleTy) {

  default:

    llvm_unreachable("Unhandled source type");

  case MVT::i8:

    switch (DestTy.SimpleTy) {

    default:

      llvm_unreachable("Unhandled dest type");

    case MVT::i16:

      return IsSigned ? NVPTX::CVT_s16_s8 : NVPTX::CVT_u16_u8;

    case MVT::i32:

      return IsSigned ? NVPTX::CVT_s32_s8 : NVPTX::CVT_u32_u8;

    case MVT::i64:

      return IsSigned ? NVPTX::CVT_s64_s8 : NVPTX::CVT_u64_u8;

    }

  case MVT::i16:

    switch (DestTy.SimpleTy) {

    default:

      llvm_unreachable("Unhandled dest type");

    case MVT::i8:

      return IsSigned ? NVPTX::CVT_s8_s16 : NVPTX::CVT_u8_u16;

    case MVT::i32:

      return IsSigned ? NVPTX::CVT_s32_s16 : NVPTX::CVT_u32_u16;

    case MVT::i64:

      return IsSigned ? NVPTX::CVT_s64_s16 : NVPTX::CVT_u64_u16;

    }

  case MVT::i32:

    switch (DestTy.SimpleTy) {

    default:

      llvm_unreachable("Unhandled dest type");

    case MVT::i8:

      return IsSigned ? NVPTX::CVT_s8_s32 : NVPTX::CVT_u8_u32;

    case MVT::i16:

      return IsSigned ? NVPTX::CVT_s16_s32 : NVPTX::CVT_u16_u32;

    case MVT::i64:

      return IsSigned ? NVPTX::CVT_s64_s32 : NVPTX::CVT_u64_u32;

    }

  case MVT::i64:

    switch (DestTy.SimpleTy) {

    default:

      llvm_unreachable("Unhandled dest type");

    case MVT::i8:

      return IsSigned ? NVPTX::CVT_s8_s64 : NVPTX::CVT_u8_u64;

    case MVT::i16:

      return IsSigned ? NVPTX::CVT_s16_s64 : NVPTX::CVT_u16_u64;

    case MVT::i32:

      return IsSigned ? NVPTX::CVT_s32_s64 : NVPTX::CVT_u32_u64;

    }

  case MVT::f16:

    switch (DestTy.SimpleTy) {

    default:

      llvm_unreachable("Unhandled dest type");

    case MVT::f32:

      return NVPTX::CVT_f32_f16;

    case MVT::f64:

      return NVPTX::CVT_f64_f16;

    }

  }

}

DL
MachineBasicBlock MachineBasicBlock::iterator DebugLoc DL
Definition: AArch64SLSHardening.cpp:74

Wrapper
amdgpu aa AMDGPU Address space based Alias Analysis Wrapper
Definition: AMDGPUAliasAnalysis.cpp:31

AtomicOrdering.h
Atomic ordering constants.

A
static GCRegistry::Add< ErlangGC > A("erlang", "erlang-compatible garbage collector")

CommandLine.h

Debug.h

Addr
uint64_t Addr
Definition: ELFObjHandler.cpp:79

DEBUG_TYPE
#define DEBUG_TYPE
Definition: GenericCycleImpl.h:30

GlobalValue.h

ISDOpcodes.h

Instructions.h

F
#define F(x, y, z)
Definition: MD5.cpp:55

NVPTXBaseInfo.h

getOpcodeForVectorStParam
#define getOpcodeForVectorStParam(n, ty, isimm)
Definition: NVPTXISelDAGToDAG.cpp:2219

getCodeAddrSpace
static unsigned int getCodeAddrSpace(MemSDNode *N)
Definition: NVPTXISelDAGToDAG.cpp:683

getLdStRegType
static int getLdStRegType(EVT VT)
Definition: NVPTXISelDAGToDAG.cpp:875

pickOpcodeForVectorStParam
static unsigned pickOpcodeForVectorStParam(SmallVector< SDValue, 8 > &Ops, unsigned NumElts, MVT::SimpleValueType MemTy, SelectionDAG *CurDAG, SDLoc DL)
Definition: NVPTXISelDAGToDAG.cpp:2223

getOpcodeForVectorStParamV2
#define getOpcodeForVectorStParamV2(ty, isimm)
Definition: NVPTXISelDAGToDAG.cpp:2197

EnableRsqrtOpt
static cl::opt< bool > EnableRsqrtOpt("nvptx-rsqrt-approx-opt", cl::init(true), cl::Hidden, cl::desc("Enable reciprocal sqrt optimization"))

getPTXCmpMode
static unsigned getPTXCmpMode(const CondCodeSDNode &CondCode, bool FTZ)
Definition: NVPTXISelDAGToDAG.cpp:560

pickOpcodeForVT
static std::optional< unsigned > pickOpcodeForVT(MVT::SimpleValueType VT, unsigned Opcode_i8, unsigned Opcode_i16, unsigned Opcode_i32, std::optional< unsigned > Opcode_i64, unsigned Opcode_f32, std::optional< unsigned > Opcode_f64)
Definition: NVPTXISelDAGToDAG.cpp:844

canLowerToLDG
static bool canLowerToLDG(MemSDNode *N, const NVPTXSubtarget &Subtarget, unsigned CodeAddrSpace, MachineFunction *F)
Definition: NVPTXISelDAGToDAG.cpp:703

NVPTXISelDAGToDAG.h

NVPTXUtilities.h

if
if(VerifyEach)
Definition: PassBuilderBindings.cpp:71

TM
const char LLVMTargetMachineRef TM
Definition: PassBuilderBindings.cpp:47

INITIALIZE_PASS
#define INITIALIZE_PASS(passName, arg, name, cfg, analysis)
Definition: PassSupport.h:38

CC
auto CC
Definition: RISCVRedundantCopyElimination.cpp:79

assert
assert(ImpDefSCC.getReg()==AMDGPU::SCC &&ImpDefSCC.isDef())

TargetIntrinsicInfo.h

PASS_NAME
#define PASS_NAME
Definition: TypePromotion.cpp:43

ValueTracking.h

RHS
Value * RHS
Definition: X86PartialReduction.cpp:76

LHS
Value * LHS
Definition: X86PartialReduction.cpp:75

Node
Definition: ItaniumDemangle.h:161

llvm::AddrSpaceCastSDNode
Definition: SelectionDAGNodes.h:1290

llvm::AddrSpaceCastSDNode::getSrcAddressSpace
unsigned getSrcAddressSpace() const
Definition: SelectionDAGNodes.h:1301

llvm::AddrSpaceCastSDNode::getDestAddressSpace
unsigned getDestAddressSpace() const
Definition: SelectionDAGNodes.h:1302

llvm::AtomicSDNode
This is an SDNode representing atomic operations.
Definition: SelectionDAGNodes.h:1484

llvm::AtomicSDNode::getVal
const SDValue & getVal() const
Definition: SelectionDAGNodes.h:1506

llvm::CondCodeSDNode
Definition: SelectionDAGNodes.h:2345

llvm::ConstantFPSDNode
Definition: SelectionDAGNodes.h:1695

llvm::ConstantFPSDNode::getConstantFPValue
const ConstantFP * getConstantFPValue() const
Definition: SelectionDAGNodes.h:1707

llvm::ConstantFP
ConstantFP - Floating Point Values [float, double].
Definition: Constants.h:269

llvm::ConstantInt
This is the shared class of boolean and integer constants.
Definition: Constants.h:81

llvm::ConstantSDNode
Definition: SelectionDAGNodes.h:1641

llvm::ConstantSDNode::getConstantIntValue
const ConstantInt * getConstantIntValue() const
Definition: SelectionDAGNodes.h:1655

llvm::ConstantSDNode::getZExtValue
uint64_t getZExtValue() const
Definition: SelectionDAGNodes.h:1657

llvm::DWARFExpression::Operation
This class represents an Operation in the Expression.
Definition: DWARFExpression.h:32

llvm::DataLayout::getPointerSizeInBits
unsigned getPointerSizeInBits(unsigned AS=0) const
Layout pointer size, in bits FIXME: The defaults need to be removed once all of the backends/clients ...
Definition: DataLayout.h:410

llvm::FrameIndexSDNode
Definition: SelectionDAGNodes.h:1855

llvm::FunctionPass
FunctionPass class - This class is used to implement most global optimizations.
Definition: Pass.h:311

llvm::InlineAsm::ConstraintCode
ConstraintCode
Definition: InlineAsm.h:239

llvm::InlineAsm::ConstraintCode::m
@ m

llvm::LSBaseSDNode::isIndexed
bool isIndexed() const
Return true if this is a pre/post inc/dec load/store.
Definition: SelectionDAGNodes.h:2403

llvm::LoadSDNode
This class is used to represent ISD::LOAD nodes.
Definition: SelectionDAGNodes.h:2415

llvm::LoadSDNode::getExtensionType
ISD::LoadExtType getExtensionType() const
Return whether this is a plain node, or one of the varieties of value-extending loads.
Definition: SelectionDAGNodes.h:2430

llvm::MVT
Machine Value Type.
Definition: MachineValueType.h:34

llvm::MVT::SimpleTy
SimpleValueType SimpleTy
Definition: MachineValueType.h:53

llvm::MVT::SimpleValueType
SimpleValueType
Definition: MachineValueType.h:36

llvm::MVT::isVector
bool isVector() const
Return true if this is a vector value type.
Definition: MachineValueType.h:104

llvm::MVT::getSizeInBits
TypeSize getSizeInBits() const
Returns the size of the specified MVT in bits.
Definition: MachineValueType.h:299

llvm::MVT::getVectorElementType
MVT getVectorElementType() const
Definition: MachineValueType.h:254

llvm::MVT::getScalarType
MVT getScalarType() const
If this is a vector, return the element type, otherwise return this.
Definition: MachineValueType.h:250

llvm::MachineFunction
Definition: MachineFunction.h:259

llvm::MachineFunction::getSubtarget
const TargetSubtargetInfo & getSubtarget() const
getSubtarget - Return the subtarget for which this machine code is being compiled.
Definition: MachineFunction.h:718

llvm::MachineMemOperand
A description of a memory reference used in the backend.
Definition: MachineMemOperand.h:129

llvm::MemSDNode
This is an abstract virtual class for memory operations.
Definition: SelectionDAGNodes.h:1310

llvm::MemSDNode::getAddressSpace
unsigned getAddressSpace() const
Return the address space for the associated pointer.
Definition: SelectionDAGNodes.h:1401

llvm::MemSDNode::isVolatile
bool isVolatile() const
Definition: SelectionDAGNodes.h:1349

llvm::MemSDNode::getMemoryVT
EVT getMemoryVT() const
Return the type of the in-memory value.
Definition: SelectionDAGNodes.h:1390

llvm::NVPTXDAGToDAGISelLegacy
Definition: NVPTXISelDAGToDAG.h:103

llvm::NVPTXDAGToDAGISelLegacy::ID
static char ID
Definition: NVPTXISelDAGToDAG.h:105

llvm::NVPTXDAGToDAGISelLegacy::NVPTXDAGToDAGISelLegacy
NVPTXDAGToDAGISelLegacy(NVPTXTargetMachine &tm, CodeGenOptLevel OptLevel)
Definition: NVPTXISelDAGToDAG.cpp:44

llvm::NVPTXDAGToDAGISel
Definition: NVPTXISelDAGToDAG.h:28

llvm::NVPTXDAGToDAGISel::runOnMachineFunction
bool runOnMachineFunction(MachineFunction &MF) override
Definition: NVPTXISelDAGToDAG.cpp:59

llvm::NVPTXDAGToDAGISel::SelectInlineAsmMemoryOperand
bool SelectInlineAsmMemoryOperand(const SDValue &Op, InlineAsm::ConstraintCode ConstraintID, std::vector< SDValue > &OutOps) override
SelectInlineAsmMemoryOperand - Implement addressing mode selection for inline asm expressions.
Definition: NVPTXISelDAGToDAG.cpp:3778

llvm::NVPTXDAGToDAGISel::Subtarget
const NVPTXSubtarget * Subtarget
Definition: NVPTXISelDAGToDAG.h:47

llvm::NVPTXSubtarget
Definition: NVPTXSubtarget.h:31

llvm::NVPTXSubtarget::getTargetLowering
const NVPTXTargetLowering * getTargetLowering() const override
Definition: NVPTXSubtarget.h:69

llvm::NVPTXSubtarget::hasLDG
bool hasLDG() const
Definition: NVPTXSubtarget.h:80

llvm::NVPTXTargetLowering
Definition: NVPTXISelLowering.h:451

llvm::NVPTXTargetLowering::useF32FTZ
bool useF32FTZ(const MachineFunction &MF) const
Definition: NVPTXISelLowering.cpp:125

llvm::NVPTXTargetLowering::allowFMA
bool allowFMA(MachineFunction &MF, CodeGenOptLevel OptLevel) const
Definition: NVPTXISelLowering.cpp:5191

llvm::NVPTXTargetLowering::usePrecSqrtF32
bool usePrecSqrtF32() const
Definition: NVPTXISelLowering.cpp:115

llvm::NVPTXTargetLowering::allowUnsafeFPMath
bool allowUnsafeFPMath(MachineFunction &MF) const
Definition: NVPTXISelLowering.cpp:5208

llvm::NVPTXTargetLowering::getDivF32Level
int getDivF32Level() const
Definition: NVPTXISelLowering.cpp:102

llvm::NVPTXTargetMachine
NVPTXTargetMachine.
Definition: NVPTXTargetMachine.h:25

llvm::NVPTXTargetMachine::is64Bit
bool is64Bit() const
Definition: NVPTXTargetMachine.h:46

llvm::SDLoc
Wrapper class for IR location info (IR ordering and DebugLoc) to be passed into SDNode creation funct...
Definition: SelectionDAGNodes.h:1139

llvm::SDNode
Represents one node in the SelectionDAG.
Definition: SelectionDAGNodes.h:477

llvm::SDNode::getOperand
const SDValue & getOperand(unsigned Num) const
Definition: SelectionDAGNodes.h:947

llvm::SDValue
Unlike LLVM values, Selection DAG nodes may return multiple values as the result of a computation.
Definition: SelectionDAGNodes.h:145

llvm::SDValue::getNode
SDNode * getNode() const
get the SDNode which holds the desired result
Definition: SelectionDAGNodes.h:159

llvm::SDValue::getValueType
EVT getValueType() const
Return the ValueType of the referenced return value.
Definition: SelectionDAGNodes.h:1174

llvm::SDValue::getValueSizeInBits
TypeSize getValueSizeInBits() const
Returns the size of the value in bits.
Definition: SelectionDAGNodes.h:199

llvm::SDValue::getOperand
const SDValue & getOperand(unsigned i) const
Definition: SelectionDAGNodes.h:1182

llvm::SDValue::getOpcode
unsigned getOpcode() const
Definition: SelectionDAGNodes.h:1170

llvm::SelectionDAGISelLegacy
Definition: SelectionDAGISel.h:529

llvm::SelectionDAGISel
SelectionDAGISel - This is the common base class used for SelectionDAG-based pattern-matching instruc...
Definition: SelectionDAGISel.h:44

llvm::SelectionDAGISel::MF
MachineFunction * MF
Definition: SelectionDAGISel.h:50

llvm::SelectionDAGISel::CurDAG
SelectionDAG * CurDAG
Definition: SelectionDAGISel.h:52

llvm::SelectionDAGISel::OptLevel
CodeGenOptLevel OptLevel
Definition: SelectionDAGISel.h:61

llvm::SelectionDAGISel::ReplaceUses
void ReplaceUses(SDValue F, SDValue T)
ReplaceUses - replace all uses of the old node F with the use of the new node T.
Definition: SelectionDAGISel.h:353

llvm::SelectionDAGISel::ReplaceNode
void ReplaceNode(SDNode *F, SDNode *T)
Replace all uses of F with T, then remove F from the DAG.
Definition: SelectionDAGISel.h:374

llvm::SelectionDAGISel::runOnMachineFunction
virtual bool runOnMachineFunction(MachineFunction &mf)
Definition: SelectionDAGISel.cpp:598

llvm::SelectionDAG
This is used to represent a portion of an LLVM function in a low-level Data Dependence DAG representa...
Definition: SelectionDAG.h:227

llvm::SelectionDAG::getVTList
SDVTList getVTList(EVT VT)
Return an SDVTList that represents the list of values specified.
Definition: SelectionDAG.cpp:10265

llvm::SelectionDAG::getMachineNode
MachineSDNode * getMachineNode(unsigned Opcode, const SDLoc &dl, EVT VT)
These are used for target selectors to create a new node with specified return type(s),...
Definition: SelectionDAG.cpp:10703

llvm::SelectionDAG::setNodeMemRefs
void setNodeMemRefs(MachineSDNode *N, ArrayRef< MachineMemOperand * > NewMemRefs)
Mutate the specified machine node's memory references to the provided list.
Definition: SelectionDAG.cpp:10471

llvm::SelectionDAG::getDataLayout
const DataLayout & getDataLayout() const
Definition: SelectionDAG.h:486

llvm::SelectionDAG::getTargetFrameIndex
SDValue getTargetFrameIndex(int FI, EVT VT)
Definition: SelectionDAG.h:741

llvm::SelectionDAG::getTargetConstantFP
SDValue getTargetConstantFP(double Val, const SDLoc &DL, EVT VT)
Definition: SelectionDAG.h:722

llvm::SelectionDAG::getTargetConstant
SDValue getTargetConstant(uint64_t Val, const SDLoc &DL, EVT VT, bool isOpaque=false)
Definition: SelectionDAG.h:690

llvm::SmallVectorBase::empty
bool empty() const
Definition: SmallVector.h:94

llvm::SmallVectorTemplateBase::push_back
void push_back(const T &Elt)
Definition: SmallVector.h:426

llvm::SmallVector
This is a 'vector' (really, a variable-sized array), optimized for the case when the array is small.
Definition: SmallVector.h:1209

llvm::StoreSDNode
This class is used to represent ISD::STORE nodes.
Definition: SelectionDAGNodes.h:2443

llvm::StoreSDNode::getValue
const SDValue & getValue() const
Definition: SelectionDAGNodes.h:2464

llvm::TargetMachine::getPointerSizeInBits
unsigned getPointerSizeInBits(unsigned AS) const
Definition: TargetMachine.h:193

llvm::Value
LLVM Value Representation.
Definition: Value.h:74

llvm::cl::opt
Definition: CommandLine.h:1430

uint64_t

unsigned

ErrorHandling.h

llvm_unreachable
#define llvm_unreachable(msg)
Marks that the current location is not supposed to be reachable.
Definition: ErrorHandling.h:143

MemRef
Definition: Lint.cpp:86

llvm::AMDGPU::HSAMD::Kernel::Arg::Key::IsVolatile
constexpr char IsVolatile[]
Key for Kernel::Arg::Metadata::mIsVolatile.
Definition: AMDGPUMetadata.h:200

llvm::ARMII::VecSize
@ VecSize
Definition: ARMBaseInfo.h:437

llvm::ARM_MB::LD
@ LD
Definition: ARMBaseInfo.h:72

llvm::ARM_MB::ST
@ ST
Definition: ARMBaseInfo.h:73

llvm::BitmaskEnumDetail::Mask
constexpr std::underlying_type_t< E > Mask()
Get a bitmask with 1s in all places up to the high-order bit of E's largest value.
Definition: BitmaskEnum.h:121

llvm::ISD::STORE
@ STORE
Definition: ISDOpcodes.h:1039

llvm::ISD::ConstantFP
@ ConstantFP
Definition: ISDOpcodes.h:77

llvm::ISD::ATOMIC_STORE
@ ATOMIC_STORE
OUTCHAIN = ATOMIC_STORE(INCHAIN, ptr, val) This corresponds to "store atomic" instruction.
Definition: ISDOpcodes.h:1248

llvm::ISD::ADD
@ ADD
Simple integer binary arithmetic operators.
Definition: ISDOpcodes.h:240

llvm::ISD::LOAD
@ LOAD
LOAD and STORE have token chains as their first operand, then the same operands as an LLVM load/store...
Definition: ISDOpcodes.h:1038

llvm::ISD::SRL
@ SRL
Definition: ISDOpcodes.h:708

llvm::ISD::SRA
@ SRA
Definition: ISDOpcodes.h:707

llvm::ISD::TargetExternalSymbol
@ TargetExternalSymbol
Definition: ISDOpcodes.h:169

llvm::ISD::ATOMIC_LOAD
@ ATOMIC_LOAD
Val, OUTCHAIN = ATOMIC_LOAD(INCHAIN, ptr) This corresponds to "load atomic" instruction.
Definition: ISDOpcodes.h:1244

llvm::ISD::TargetGlobalAddress
@ TargetGlobalAddress
TargetGlobalAddress - Like GlobalAddress, but the DAG does no folding or anything else with this node...
Definition: ISDOpcodes.h:164

llvm::ISD::SHL
@ SHL
Shift and rotation operations.
Definition: ISDOpcodes.h:706

llvm::ISD::EXTRACT_VECTOR_ELT
@ EXTRACT_VECTOR_ELT
EXTRACT_VECTOR_ELT(VECTOR, IDX) - Returns a single element from VECTOR identified by the (potentially...
Definition: ISDOpcodes.h:536

llvm::ISD::AND
@ AND
Bitwise operators - logical and, logical or, logical xor.
Definition: ISDOpcodes.h:681

llvm::ISD::INTRINSIC_WO_CHAIN
@ INTRINSIC_WO_CHAIN
RESULT = INTRINSIC_WO_CHAIN(INTRINSICID, arg1, arg2, ...) This node represents a target intrinsic fun...
Definition: ISDOpcodes.h:184

llvm::ISD::ADDRSPACECAST
@ ADDRSPACECAST
ADDRSPACECAST - This operator converts between pointers of different address spaces.
Definition: ISDOpcodes.h:908

llvm::ISD::INTRINSIC_W_CHAIN
@ INTRINSIC_W_CHAIN
RESULT,OUTCHAIN = INTRINSIC_W_CHAIN(INCHAIN, INTRINSICID, arg1, ...) This node represents a target in...
Definition: ISDOpcodes.h:192

llvm::ISD::CondCode
CondCode
ISD::CondCode enum - These are ordered carefully to make the bitfields below work out,...
Definition: ISDOpcodes.h:1540

llvm::ISD::SETOEQ
@ SETOEQ
Definition: ISDOpcodes.h:1543

llvm::ISD::SETUNE
@ SETUNE
Definition: ISDOpcodes.h:1556

llvm::ISD::SETUEQ
@ SETUEQ
Definition: ISDOpcodes.h:1551

llvm::ISD::SETOLE
@ SETOLE
Definition: ISDOpcodes.h:1547

llvm::ISD::SETOLT
@ SETOLT
Definition: ISDOpcodes.h:1546

llvm::ISD::SETNE
@ SETNE
Definition: ISDOpcodes.h:1565

llvm::ISD::SETUGT
@ SETUGT
Definition: ISDOpcodes.h:1552

llvm::ISD::SETOGT
@ SETOGT
Definition: ISDOpcodes.h:1544

llvm::ISD::SETULT
@ SETULT
Definition: ISDOpcodes.h:1554

llvm::ISD::SETUO
@ SETUO
Definition: ISDOpcodes.h:1550

llvm::ISD::SETONE
@ SETONE
Definition: ISDOpcodes.h:1548

llvm::ISD::SETGT
@ SETGT
Definition: ISDOpcodes.h:1561

llvm::ISD::SETLT
@ SETLT
Definition: ISDOpcodes.h:1563

llvm::ISD::SETO
@ SETO
Definition: ISDOpcodes.h:1549

llvm::ISD::SETGE
@ SETGE
Definition: ISDOpcodes.h:1562

llvm::ISD::SETUGE
@ SETUGE
Definition: ISDOpcodes.h:1553

llvm::ISD::SETLE
@ SETLE
Definition: ISDOpcodes.h:1564

llvm::ISD::SETULE
@ SETULE
Definition: ISDOpcodes.h:1555

llvm::ISD::SETOGE
@ SETOGE
Definition: ISDOpcodes.h:1545

llvm::ISD::SETEQ
@ SETEQ
Definition: ISDOpcodes.h:1560

llvm::ISD::SEXTLOAD
@ SEXTLOAD
Definition: ISDOpcodes.h:1520

llvm::M68k::MemAddrModeKind::U
@ U

llvm::MipsISD::Ret
@ Ret
Definition: MipsISelLowering.h:117

llvm::NVPTXISD::Suld2DArrayV2I32Zero
@ Suld2DArrayV2I32Zero
Definition: NVPTXISelLowering.h:426

llvm::NVPTXISD::Suld1DV2I8Clamp
@ Suld1DV2I8Clamp
Definition: NVPTXISelLowering.h:268

llvm::NVPTXISD::Suld2DArrayI8Clamp
@ Suld2DArrayI8Clamp
Definition: NVPTXISelLowering.h:300

llvm::NVPTXISD::TexUnifiedCubeS32Float
@ TexUnifiedCubeS32Float
Definition: NVPTXISelLowering.h:234

llvm::NVPTXISD::TexUnified1DS32FloatLevel
@ TexUnified1DS32FloatLevel
Definition: NVPTXISelLowering.h:178

llvm::NVPTXISD::Tex2DU32FloatGrad
@ Tex2DU32FloatGrad
Definition: NVPTXISelLowering.h:123

llvm::NVPTXISD::Suld3DV2I16Zero
@ Suld3DV2I16Zero
Definition: NVPTXISelLowering.h:437

llvm::NVPTXISD::Tex1DFloatFloatLevel
@ Tex1DFloatFloatLevel
Definition: NVPTXISelLowering.h:90

llvm::NVPTXISD::Tex1DArrayFloatFloatLevel
@ Tex1DArrayFloatFloatLevel
Definition: NVPTXISelLowering.h:102

llvm::NVPTXISD::Suld1DI16Clamp
@ Suld1DI16Clamp
Definition: NVPTXISelLowering.h:265

llvm::NVPTXISD::Suld3DV4I8Clamp
@ Suld3DV4I8Clamp
Definition: NVPTXISelLowering.h:320

llvm::NVPTXISD::Suld2DV4I16Zero
@ Suld2DV4I16Zero
Definition: NVPTXISelLowering.h:417

llvm::NVPTXISD::Suld2DArrayI64Trap
@ Suld2DArrayI64Trap
Definition: NVPTXISelLowering.h:363

llvm::NVPTXISD::TexUnified2DU32FloatGrad
@ TexUnified2DU32FloatGrad
Definition: NVPTXISelLowering.h:207

llvm::NVPTXISD::Suld2DArrayV4I16Trap
@ Suld2DArrayV4I16Trap
Definition: NVPTXISelLowering.h:369

llvm::NVPTXISD::Tld4UnifiedG2DS64Float
@ Tld4UnifiedG2DS64Float
Definition: NVPTXISelLowering.h:255

llvm::NVPTXISD::TexUnified3DFloatS32
@ TexUnified3DFloatS32
Definition: NVPTXISelLowering.h:220

llvm::NVPTXISD::Tex2DArrayS32FloatGrad
@ Tex2DArrayS32FloatGrad
Definition: NVPTXISelLowering.h:131

llvm::NVPTXISD::Tld4UnifiedG2DFloatFloat
@ Tld4UnifiedG2DFloatFloat
Definition: NVPTXISelLowering.h:251

llvm::NVPTXISD::Suld1DV4I32Trap
@ Suld1DV4I32Trap
Definition: NVPTXISelLowering.h:334

llvm::NVPTXISD::Suld1DI16Zero
@ Suld1DI16Zero
Definition: NVPTXISelLowering.h:385

llvm::NVPTXISD::Suld2DI64Zero
@ Suld2DI64Zero
Definition: NVPTXISelLowering.h:411

llvm::NVPTXISD::Suld1DI32Clamp
@ Suld1DI32Clamp
Definition: NVPTXISelLowering.h:266

llvm::NVPTXISD::Tex2DFloatFloat
@ Tex2DFloatFloat
Definition: NVPTXISelLowering.h:113

llvm::NVPTXISD::Suld1DV2I8Zero
@ Suld1DV2I8Zero
Definition: NVPTXISelLowering.h:388

llvm::NVPTXISD::TexUnifiedCubeArrayFloatFloatLevel
@ TexUnifiedCubeArrayFloatFloatLevel
Definition: NVPTXISelLowering.h:239

llvm::NVPTXISD::Tld4UnifiedR2DFloatFloat
@ Tld4UnifiedR2DFloatFloat
Definition: NVPTXISelLowering.h:250

llvm::NVPTXISD::Suld1DI64Zero
@ Suld1DI64Zero
Definition: NVPTXISelLowering.h:387

llvm::NVPTXISD::Suld3DV4I16Clamp
@ Suld3DV4I16Clamp
Definition: NVPTXISelLowering.h:321

llvm::NVPTXISD::TexUnified2DU32S32
@ TexUnified2DU32S32
Definition: NVPTXISelLowering.h:204

llvm::NVPTXISD::Tex2DArrayS32FloatLevel
@ Tex2DArrayS32FloatLevel
Definition: NVPTXISelLowering.h:130

llvm::NVPTXISD::Suld1DV4I16Zero
@ Suld1DV4I16Zero
Definition: NVPTXISelLowering.h:393

llvm::NVPTXISD::Suld2DV2I8Trap
@ Suld2DV2I8Trap
Definition: NVPTXISelLowering.h:352

llvm::NVPTXISD::Tex2DArrayU32Float
@ Tex2DArrayU32Float
Definition: NVPTXISelLowering.h:133

llvm::NVPTXISD::TexUnified1DArrayFloatFloatLevel
@ TexUnified1DArrayFloatFloatLevel
Definition: NVPTXISelLowering.h:186

llvm::NVPTXISD::TexUnified2DFloatFloatLevel
@ TexUnified2DFloatFloatLevel
Definition: NVPTXISelLowering.h:198

llvm::NVPTXISD::Suld1DArrayV4I32Trap
@ Suld1DArrayV4I32Trap
Definition: NVPTXISelLowering.h:346

llvm::NVPTXISD::Suld1DArrayV4I16Trap
@ Suld1DArrayV4I16Trap
Definition: NVPTXISelLowering.h:345

llvm::NVPTXISD::TexUnified3DFloatFloatLevel
@ TexUnified3DFloatFloatLevel
Definition: NVPTXISelLowering.h:222

llvm::NVPTXISD::TexUnified1DFloatFloatLevel
@ TexUnified1DFloatFloatLevel
Definition: NVPTXISelLowering.h:174

llvm::NVPTXISD::TexUnified2DArrayU32Float
@ TexUnified2DArrayU32Float
Definition: NVPTXISelLowering.h:217

llvm::NVPTXISD::Tex1DArrayS32FloatGrad
@ Tex1DArrayS32FloatGrad
Definition: NVPTXISelLowering.h:107

llvm::NVPTXISD::TexUnified1DArrayFloatFloat
@ TexUnified1DArrayFloatFloat
Definition: NVPTXISelLowering.h:185

llvm::NVPTXISD::Tex2DFloatFloatGrad
@ Tex2DFloatFloatGrad
Definition: NVPTXISelLowering.h:115

llvm::NVPTXISD::Tex1DArrayFloatFloatGrad
@ Tex1DArrayFloatFloatGrad
Definition: NVPTXISelLowering.h:103

llvm::NVPTXISD::Tld4R2DFloatFloat
@ Tld4R2DFloatFloat
Definition: NVPTXISelLowering.h:160

llvm::NVPTXISD::TexUnifiedCubeArrayU32FloatGrad
@ TexUnifiedCubeArrayU32FloatGrad
Definition: NVPTXISelLowering.h:249

llvm::NVPTXISD::TexUnified1DFloatFloatGrad
@ TexUnified1DFloatFloatGrad
Definition: NVPTXISelLowering.h:175

llvm::NVPTXISD::Tex1DArrayU32S32
@ Tex1DArrayU32S32
Definition: NVPTXISelLowering.h:108

llvm::NVPTXISD::Suld1DArrayV2I32Clamp
@ Suld1DArrayV2I32Clamp
Definition: NVPTXISelLowering.h:282

llvm::NVPTXISD::Suld2DArrayV4I32Trap
@ Suld2DArrayV4I32Trap
Definition: NVPTXISelLowering.h:370

llvm::NVPTXISD::TexUnifiedCubeFloatFloatGrad
@ TexUnifiedCubeFloatFloatGrad
Definition: NVPTXISelLowering.h:244

llvm::NVPTXISD::Tex1DU32FloatLevel
@ Tex1DU32FloatLevel
Definition: NVPTXISelLowering.h:98

llvm::NVPTXISD::TexUnified2DArrayFloatFloat
@ TexUnified2DArrayFloatFloat
Definition: NVPTXISelLowering.h:209

llvm::NVPTXISD::TexUnified1DU32Float
@ TexUnified1DU32Float
Definition: NVPTXISelLowering.h:181

llvm::NVPTXISD::TexUnified3DU32FloatLevel
@ TexUnified3DU32FloatLevel
Definition: NVPTXISelLowering.h:230

llvm::NVPTXISD::Tex2DFloatFloatLevel
@ Tex2DFloatFloatLevel
Definition: NVPTXISelLowering.h:114

llvm::NVPTXISD::Tld4UnifiedB2DU64Float
@ Tld4UnifiedB2DU64Float
Definition: NVPTXISelLowering.h:260

llvm::NVPTXISD::Suld1DV2I32Zero
@ Suld1DV2I32Zero
Definition: NVPTXISelLowering.h:390

llvm::NVPTXISD::Tex1DArrayU32Float
@ Tex1DArrayU32Float
Definition: NVPTXISelLowering.h:109

llvm::NVPTXISD::Tex2DS32FloatGrad
@ Tex2DS32FloatGrad
Definition: NVPTXISelLowering.h:119

llvm::NVPTXISD::TexUnified1DArrayU32Float
@ TexUnified1DArrayU32Float
Definition: NVPTXISelLowering.h:193

llvm::NVPTXISD::Tld4B2DFloatFloat
@ Tld4B2DFloatFloat
Definition: NVPTXISelLowering.h:162

llvm::NVPTXISD::Suld2DI16Zero
@ Suld2DI16Zero
Definition: NVPTXISelLowering.h:409

llvm::NVPTXISD::Suld1DV4I16Trap
@ Suld1DV4I16Trap
Definition: NVPTXISelLowering.h:333

llvm::NVPTXISD::Tex3DU32S32
@ Tex3DU32S32
Definition: NVPTXISelLowering.h:144

llvm::NVPTXISD::TexUnified2DArrayFloatFloatLevel
@ TexUnified2DArrayFloatFloatLevel
Definition: NVPTXISelLowering.h:210

llvm::NVPTXISD::TexUnified3DS32Float
@ TexUnified3DS32Float
Definition: NVPTXISelLowering.h:225

llvm::NVPTXISD::StoreParamS32
@ StoreParamS32
Definition: NVPTXISelLowering.h:81

llvm::NVPTXISD::Suld1DArrayI64Clamp
@ Suld1DArrayI64Clamp
Definition: NVPTXISelLowering.h:279

llvm::NVPTXISD::Tld4G2DU64Float
@ Tld4G2DU64Float
Definition: NVPTXISelLowering.h:169

llvm::NVPTXISD::Tex2DFloatS32
@ Tex2DFloatS32
Definition: NVPTXISelLowering.h:112

llvm::NVPTXISD::MoveParam
@ MoveParam
Definition: NVPTXISelLowering.h:47

llvm::NVPTXISD::TexCubeFloatFloatLevel
@ TexCubeFloatFloatLevel
Definition: NVPTXISelLowering.h:149

llvm::NVPTXISD::Suld2DArrayV2I8Zero
@ Suld2DArrayV2I8Zero
Definition: NVPTXISelLowering.h:424

llvm::NVPTXISD::Suld2DArrayI16Zero
@ Suld2DArrayI16Zero
Definition: NVPTXISelLowering.h:421

llvm::NVPTXISD::Tex1DU32S32
@ Tex1DU32S32
Definition: NVPTXISelLowering.h:96

llvm::NVPTXISD::Tex1DS32FloatLevel
@ Tex1DS32FloatLevel
Definition: NVPTXISelLowering.h:94

llvm::NVPTXISD::Tld4G2DFloatFloat
@ Tld4G2DFloatFloat
Definition: NVPTXISelLowering.h:161

llvm::NVPTXISD::Suld3DI64Trap
@ Suld3DI64Trap
Definition: NVPTXISelLowering.h:375

llvm::NVPTXISD::Suld1DArrayV2I64Trap
@ Suld1DArrayV2I64Trap
Definition: NVPTXISelLowering.h:343

llvm::NVPTXISD::Tex1DArrayS32S32
@ Tex1DArrayS32S32
Definition: NVPTXISelLowering.h:104

llvm::NVPTXISD::Suld2DArrayV2I64Trap
@ Suld2DArrayV2I64Trap
Definition: NVPTXISelLowering.h:367

llvm::NVPTXISD::LoadParamV2
@ LoadParamV2
Definition: NVPTXISelLowering.h:76

llvm::NVPTXISD::Suld1DI8Trap
@ Suld1DI8Trap
Definition: NVPTXISelLowering.h:324

llvm::NVPTXISD::TexCubeU32FloatLevel
@ TexCubeU32FloatLevel
Definition: NVPTXISelLowering.h:153

llvm::NVPTXISD::Suld3DV2I16Trap
@ Suld3DV2I16Trap
Definition: NVPTXISelLowering.h:377

llvm::NVPTXISD::LDGV4
@ LDGV4
Definition: NVPTXISelLowering.h:70

llvm::NVPTXISD::Suld1DArrayV2I8Trap
@ Suld1DArrayV2I8Trap
Definition: NVPTXISelLowering.h:340

llvm::NVPTXISD::Suld3DI8Zero
@ Suld3DI8Zero
Definition: NVPTXISelLowering.h:432

llvm::NVPTXISD::Suld3DV2I8Trap
@ Suld3DV2I8Trap
Definition: NVPTXISelLowering.h:376

llvm::NVPTXISD::TexCubeFloatFloat
@ TexCubeFloatFloat
Definition: NVPTXISelLowering.h:148

llvm::NVPTXISD::TexUnified2DFloatFloatGrad
@ TexUnified2DFloatFloatGrad
Definition: NVPTXISelLowering.h:199

llvm::NVPTXISD::TexUnified2DArrayU32S32
@ TexUnified2DArrayU32S32
Definition: NVPTXISelLowering.h:216

llvm::NVPTXISD::StoreV2
@ StoreV2
Definition: NVPTXISelLowering.h:73

llvm::NVPTXISD::Suld1DV2I32Clamp
@ Suld1DV2I32Clamp
Definition: NVPTXISelLowering.h:270

llvm::NVPTXISD::TexUnifiedCubeArrayS32FloatLevel
@ TexUnifiedCubeArrayS32FloatLevel
Definition: NVPTXISelLowering.h:241

llvm::NVPTXISD::Suld2DI16Clamp
@ Suld2DI16Clamp
Definition: NVPTXISelLowering.h:289

llvm::NVPTXISD::Tex1DArrayS32Float
@ Tex1DArrayS32Float
Definition: NVPTXISelLowering.h:105

llvm::NVPTXISD::Suld1DI32Trap
@ Suld1DI32Trap
Definition: NVPTXISelLowering.h:326

llvm::NVPTXISD::Suld2DArrayI64Clamp
@ Suld2DArrayI64Clamp
Definition: NVPTXISelLowering.h:303

llvm::NVPTXISD::Tex2DU32S32
@ Tex2DU32S32
Definition: NVPTXISelLowering.h:120

llvm::NVPTXISD::TexUnified1DArrayS32Float
@ TexUnified1DArrayS32Float
Definition: NVPTXISelLowering.h:189

llvm::NVPTXISD::TexUnified1DArrayS32FloatLevel
@ TexUnified1DArrayS32FloatLevel
Definition: NVPTXISelLowering.h:190

llvm::NVPTXISD::Suld2DArrayV2I16Clamp
@ Suld2DArrayV2I16Clamp
Definition: NVPTXISelLowering.h:305

llvm::NVPTXISD::TexUnified2DS32FloatLevel
@ TexUnified2DS32FloatLevel
Definition: NVPTXISelLowering.h:202

llvm::NVPTXISD::TexCubeU32Float
@ TexCubeU32Float
Definition: NVPTXISelLowering.h:152

llvm::NVPTXISD::Suld1DArrayI32Trap
@ Suld1DArrayI32Trap
Definition: NVPTXISelLowering.h:338

llvm::NVPTXISD::TexCubeS32FloatLevel
@ TexCubeS32FloatLevel
Definition: NVPTXISelLowering.h:151

llvm::NVPTXISD::Suld1DV2I32Trap
@ Suld1DV2I32Trap
Definition: NVPTXISelLowering.h:330

llvm::NVPTXISD::Suld3DV4I16Zero
@ Suld3DV4I16Zero
Definition: NVPTXISelLowering.h:441

llvm::NVPTXISD::Suld1DArrayI16Clamp
@ Suld1DArrayI16Clamp
Definition: NVPTXISelLowering.h:277

llvm::NVPTXISD::TexUnified3DU32FloatGrad
@ TexUnified3DU32FloatGrad
Definition: NVPTXISelLowering.h:231

llvm::NVPTXISD::TexUnifiedCubeU32FloatLevel
@ TexUnifiedCubeU32FloatLevel
Definition: NVPTXISelLowering.h:237

llvm::NVPTXISD::TexUnified2DArrayU32FloatGrad
@ TexUnified2DArrayU32FloatGrad
Definition: NVPTXISelLowering.h:219

llvm::NVPTXISD::TexUnifiedCubeFloatFloatLevel
@ TexUnifiedCubeFloatFloatLevel
Definition: NVPTXISelLowering.h:233

llvm::NVPTXISD::StoreRetval
@ StoreRetval
Definition: NVPTXISelLowering.h:83

llvm::NVPTXISD::Tex1DS32Float
@ Tex1DS32Float
Definition: NVPTXISelLowering.h:93

llvm::NVPTXISD::TexUnified1DArrayFloatS32
@ TexUnified1DArrayFloatS32
Definition: NVPTXISelLowering.h:184

llvm::NVPTXISD::Suld2DV2I32Trap
@ Suld2DV2I32Trap
Definition: NVPTXISelLowering.h:354

llvm::NVPTXISD::Tex3DS32S32
@ Tex3DS32S32
Definition: NVPTXISelLowering.h:140

llvm::NVPTXISD::StoreRetvalV2
@ StoreRetvalV2
Definition: NVPTXISelLowering.h:84

llvm::NVPTXISD::LDUV2
@ LDUV2
Definition: NVPTXISelLowering.h:71

llvm::NVPTXISD::TexUnifiedCubeS32FloatLevel
@ TexUnifiedCubeS32FloatLevel
Definition: NVPTXISelLowering.h:235

llvm::NVPTXISD::Suld1DArrayV2I64Clamp
@ Suld1DArrayV2I64Clamp
Definition: NVPTXISelLowering.h:283

llvm::NVPTXISD::Suld2DArrayI16Clamp
@ Suld2DArrayI16Clamp
Definition: NVPTXISelLowering.h:301

llvm::NVPTXISD::TexUnified1DS32FloatGrad
@ TexUnified1DS32FloatGrad
Definition: NVPTXISelLowering.h:179

llvm::NVPTXISD::Suld2DV2I8Clamp
@ Suld2DV2I8Clamp
Definition: NVPTXISelLowering.h:292

llvm::NVPTXISD::Suld2DI32Trap
@ Suld2DI32Trap
Definition: NVPTXISelLowering.h:350

llvm::NVPTXISD::Suld1DV2I64Zero
@ Suld1DV2I64Zero
Definition: NVPTXISelLowering.h:391

llvm::NVPTXISD::Suld1DArrayI64Trap
@ Suld1DArrayI64Trap
Definition: NVPTXISelLowering.h:339

llvm::NVPTXISD::Suld1DArrayV4I16Zero
@ Suld1DArrayV4I16Zero
Definition: NVPTXISelLowering.h:405

llvm::NVPTXISD::Suld1DArrayV2I64Zero
@ Suld1DArrayV2I64Zero
Definition: NVPTXISelLowering.h:403

llvm::NVPTXISD::Suld1DArrayV4I8Zero
@ Suld1DArrayV4I8Zero
Definition: NVPTXISelLowering.h:404

llvm::NVPTXISD::Suld2DArrayI8Trap
@ Suld2DArrayI8Trap
Definition: NVPTXISelLowering.h:360

llvm::NVPTXISD::Suld3DV2I64Clamp
@ Suld3DV2I64Clamp
Definition: NVPTXISelLowering.h:319

llvm::NVPTXISD::Suld3DV2I64Zero
@ Suld3DV2I64Zero
Definition: NVPTXISelLowering.h:439

llvm::NVPTXISD::SETP_F16X2
@ SETP_F16X2
Definition: NVPTXISelLowering.h:59

llvm::NVPTXISD::Suld3DI64Zero
@ Suld3DI64Zero
Definition: NVPTXISelLowering.h:435

llvm::NVPTXISD::TexUnified3DU32Float
@ TexUnified3DU32Float
Definition: NVPTXISelLowering.h:229

llvm::NVPTXISD::StoreV4
@ StoreV4
Definition: NVPTXISelLowering.h:74

llvm::NVPTXISD::Suld1DArrayV2I32Zero
@ Suld1DArrayV2I32Zero
Definition: NVPTXISelLowering.h:402

llvm::NVPTXISD::TexCubeS32Float
@ TexCubeS32Float
Definition: NVPTXISelLowering.h:150

llvm::NVPTXISD::Tld4UnifiedR2DU64Float
@ Tld4UnifiedR2DU64Float
Definition: NVPTXISelLowering.h:258

llvm::NVPTXISD::Suld1DArrayI32Clamp
@ Suld1DArrayI32Clamp
Definition: NVPTXISelLowering.h:278

llvm::NVPTXISD::Suld1DArrayV2I16Zero
@ Suld1DArrayV2I16Zero
Definition: NVPTXISelLowering.h:401

llvm::NVPTXISD::Tex2DArrayFloatFloatLevel
@ Tex2DArrayFloatFloatLevel
Definition: NVPTXISelLowering.h:126

llvm::NVPTXISD::Suld1DV4I8Clamp
@ Suld1DV4I8Clamp
Definition: NVPTXISelLowering.h:272

llvm::NVPTXISD::Suld2DArrayV2I16Zero
@ Suld2DArrayV2I16Zero
Definition: NVPTXISelLowering.h:425

llvm::NVPTXISD::Tex3DFloatFloatGrad
@ Tex3DFloatFloatGrad
Definition: NVPTXISelLowering.h:139

llvm::NVPTXISD::Suld2DV4I32Clamp
@ Suld2DV4I32Clamp
Definition: NVPTXISelLowering.h:298

llvm::NVPTXISD::Suld2DV4I32Trap
@ Suld2DV4I32Trap
Definition: NVPTXISelLowering.h:358

llvm::NVPTXISD::TexUnifiedCubeArrayFloatFloat
@ TexUnifiedCubeArrayFloatFloat
Definition: NVPTXISelLowering.h:238

llvm::NVPTXISD::Tld4A2DU64Float
@ Tld4A2DU64Float
Definition: NVPTXISelLowering.h:171

llvm::NVPTXISD::Suld1DArrayI16Zero
@ Suld1DArrayI16Zero
Definition: NVPTXISelLowering.h:397

llvm::NVPTXISD::Suld2DArrayV2I32Trap
@ Suld2DArrayV2I32Trap
Definition: NVPTXISelLowering.h:366

llvm::NVPTXISD::Suld1DV2I64Clamp
@ Suld1DV2I64Clamp
Definition: NVPTXISelLowering.h:271

llvm::NVPTXISD::Suld3DV4I32Trap
@ Suld3DV4I32Trap
Definition: NVPTXISelLowering.h:382

llvm::NVPTXISD::LoadParamV4
@ LoadParamV4
Definition: NVPTXISelLowering.h:77

llvm::NVPTXISD::Suld1DArrayI32Zero
@ Suld1DArrayI32Zero
Definition: NVPTXISelLowering.h:398

llvm::NVPTXISD::Suld3DI8Trap
@ Suld3DI8Trap
Definition: NVPTXISelLowering.h:372

llvm::NVPTXISD::Suld1DArrayV4I16Clamp
@ Suld1DArrayV4I16Clamp
Definition: NVPTXISelLowering.h:285

llvm::NVPTXISD::Suld2DArrayV2I32Clamp
@ Suld2DArrayV2I32Clamp
Definition: NVPTXISelLowering.h:306

llvm::NVPTXISD::Suld1DI8Clamp
@ Suld1DI8Clamp
Definition: NVPTXISelLowering.h:264

llvm::NVPTXISD::Suld2DI8Trap
@ Suld2DI8Trap
Definition: NVPTXISelLowering.h:348

llvm::NVPTXISD::Tex2DArrayFloatFloat
@ Tex2DArrayFloatFloat
Definition: NVPTXISelLowering.h:125

llvm::NVPTXISD::Tex3DU32FloatLevel
@ Tex3DU32FloatLevel
Definition: NVPTXISelLowering.h:146

llvm::NVPTXISD::Tex3DS32FloatLevel
@ Tex3DS32FloatLevel
Definition: NVPTXISelLowering.h:142

llvm::NVPTXISD::Suld1DV2I8Trap
@ Suld1DV2I8Trap
Definition: NVPTXISelLowering.h:328

llvm::NVPTXISD::TexUnifiedCubeArrayFloatFloatGrad
@ TexUnifiedCubeArrayFloatFloatGrad
Definition: NVPTXISelLowering.h:247

llvm::NVPTXISD::TexUnified1DFloatS32
@ TexUnified1DFloatS32
Definition: NVPTXISelLowering.h:172

llvm::NVPTXISD::Suld2DArrayV4I8Trap
@ Suld2DArrayV4I8Trap
Definition: NVPTXISelLowering.h:368

llvm::NVPTXISD::Suld3DI32Trap
@ Suld3DI32Trap
Definition: NVPTXISelLowering.h:374

llvm::NVPTXISD::TexUnified2DU32Float
@ TexUnified2DU32Float
Definition: NVPTXISelLowering.h:205

llvm::NVPTXISD::Suld2DArrayV2I64Clamp
@ Suld2DArrayV2I64Clamp
Definition: NVPTXISelLowering.h:307

llvm::NVPTXISD::Suld1DArrayI8Zero
@ Suld1DArrayI8Zero
Definition: NVPTXISelLowering.h:396

llvm::NVPTXISD::Suld1DArrayI8Clamp
@ Suld1DArrayI8Clamp
Definition: NVPTXISelLowering.h:276

llvm::NVPTXISD::Suld2DI16Trap
@ Suld2DI16Trap
Definition: NVPTXISelLowering.h:349

llvm::NVPTXISD::Suld2DV4I32Zero
@ Suld2DV4I32Zero
Definition: NVPTXISelLowering.h:418

llvm::NVPTXISD::Suld2DV4I16Trap
@ Suld2DV4I16Trap
Definition: NVPTXISelLowering.h:357

llvm::NVPTXISD::Tex2DArrayS32Float
@ Tex2DArrayS32Float
Definition: NVPTXISelLowering.h:129

llvm::NVPTXISD::Suld2DArrayV2I8Clamp
@ Suld2DArrayV2I8Clamp
Definition: NVPTXISelLowering.h:304

llvm::NVPTXISD::Tld4R2DU64Float
@ Tld4R2DU64Float
Definition: NVPTXISelLowering.h:168

llvm::NVPTXISD::Suld1DArrayV4I8Trap
@ Suld1DArrayV4I8Trap
Definition: NVPTXISelLowering.h:344

llvm::NVPTXISD::Tex2DS32Float
@ Tex2DS32Float
Definition: NVPTXISelLowering.h:117

llvm::NVPTXISD::TexUnifiedCubeFloatFloat
@ TexUnifiedCubeFloatFloat
Definition: NVPTXISelLowering.h:232

llvm::NVPTXISD::TexUnified1DArrayU32S32
@ TexUnified1DArrayU32S32
Definition: NVPTXISelLowering.h:192

llvm::NVPTXISD::TexUnified3DFloatFloatGrad
@ TexUnified3DFloatFloatGrad
Definition: NVPTXISelLowering.h:223

llvm::NVPTXISD::Suld2DArrayV4I8Zero
@ Suld2DArrayV4I8Zero
Definition: NVPTXISelLowering.h:428

llvm::NVPTXISD::TexUnified1DFloatFloat
@ TexUnified1DFloatFloat
Definition: NVPTXISelLowering.h:173

llvm::NVPTXISD::TexCubeArrayFloatFloat
@ TexCubeArrayFloatFloat
Definition: NVPTXISelLowering.h:154

llvm::NVPTXISD::Suld2DV2I32Clamp
@ Suld2DV2I32Clamp
Definition: NVPTXISelLowering.h:294

llvm::NVPTXISD::Suld3DI8Clamp
@ Suld3DI8Clamp
Definition: NVPTXISelLowering.h:312

llvm::NVPTXISD::Suld2DArrayV4I8Clamp
@ Suld2DArrayV4I8Clamp
Definition: NVPTXISelLowering.h:308

llvm::NVPTXISD::Suld2DI32Clamp
@ Suld2DI32Clamp
Definition: NVPTXISelLowering.h:290

llvm::NVPTXISD::Tld4UnifiedA2DFloatFloat
@ Tld4UnifiedA2DFloatFloat
Definition: NVPTXISelLowering.h:253

llvm::NVPTXISD::Suld2DV2I64Zero
@ Suld2DV2I64Zero
Definition: NVPTXISelLowering.h:415

llvm::NVPTXISD::TexUnified3DS32FloatGrad
@ TexUnified3DS32FloatGrad
Definition: NVPTXISelLowering.h:227

llvm::NVPTXISD::Suld2DI8Clamp
@ Suld2DI8Clamp
Definition: NVPTXISelLowering.h:288

llvm::NVPTXISD::TexUnified2DS32Float
@ TexUnified2DS32Float
Definition: NVPTXISelLowering.h:201

llvm::NVPTXISD::TexUnified2DU32FloatLevel
@ TexUnified2DU32FloatLevel
Definition: NVPTXISelLowering.h:206

llvm::NVPTXISD::LoadV2
@ LoadV2
Definition: NVPTXISelLowering.h:67

llvm::NVPTXISD::Suld2DArrayV4I32Clamp
@ Suld2DArrayV4I32Clamp
Definition: NVPTXISelLowering.h:310

llvm::NVPTXISD::TexUnified1DArrayS32S32
@ TexUnified1DArrayS32S32
Definition: NVPTXISelLowering.h:188

llvm::NVPTXISD::Suld1DArrayV4I8Clamp
@ Suld1DArrayV4I8Clamp
Definition: NVPTXISelLowering.h:284

llvm::NVPTXISD::TexCubeArrayFloatFloatLevel
@ TexCubeArrayFloatFloatLevel
Definition: NVPTXISelLowering.h:155

llvm::NVPTXISD::TexUnified2DFloatS32
@ TexUnified2DFloatS32
Definition: NVPTXISelLowering.h:196

llvm::NVPTXISD::Tex3DFloatS32
@ Tex3DFloatS32
Definition: NVPTXISelLowering.h:136

llvm::NVPTXISD::Suld1DV4I8Trap
@ Suld1DV4I8Trap
Definition: NVPTXISelLowering.h:332

llvm::NVPTXISD::StoreRetvalV4
@ StoreRetvalV4
Definition: NVPTXISelLowering.h:85

llvm::NVPTXISD::Suld2DArrayI16Trap
@ Suld2DArrayI16Trap
Definition: NVPTXISelLowering.h:361

llvm::NVPTXISD::Tex3DFloatFloatLevel
@ Tex3DFloatFloatLevel
Definition: NVPTXISelLowering.h:138

llvm::NVPTXISD::Tex1DArrayFloatFloat
@ Tex1DArrayFloatFloat
Definition: NVPTXISelLowering.h:101

llvm::NVPTXISD::Suld3DI32Clamp
@ Suld3DI32Clamp
Definition: NVPTXISelLowering.h:314

llvm::NVPTXISD::StoreParamV4
@ StoreParamV4
Definition: NVPTXISelLowering.h:80

llvm::NVPTXISD::TexUnified1DU32FloatGrad
@ TexUnified1DU32FloatGrad
Definition: NVPTXISelLowering.h:183

llvm::NVPTXISD::TexCubeArrayS32FloatLevel
@ TexCubeArrayS32FloatLevel
Definition: NVPTXISelLowering.h:157

llvm::NVPTXISD::Tex2DArrayU32FloatLevel
@ Tex2DArrayU32FloatLevel
Definition: NVPTXISelLowering.h:134

llvm::NVPTXISD::Tex1DArrayU32FloatLevel
@ Tex1DArrayU32FloatLevel
Definition: NVPTXISelLowering.h:110

llvm::NVPTXISD::Suld3DV2I16Clamp
@ Suld3DV2I16Clamp
Definition: NVPTXISelLowering.h:317

llvm::NVPTXISD::StoreParamV2
@ StoreParamV2
Definition: NVPTXISelLowering.h:79

llvm::NVPTXISD::Tex2DArrayU32FloatGrad
@ Tex2DArrayU32FloatGrad
Definition: NVPTXISelLowering.h:135

llvm::NVPTXISD::Tex2DU32Float
@ Tex2DU32Float
Definition: NVPTXISelLowering.h:121

llvm::NVPTXISD::TexUnified2DArrayU32FloatLevel
@ TexUnified2DArrayU32FloatLevel
Definition: NVPTXISelLowering.h:218

llvm::NVPTXISD::TexUnified1DArrayFloatFloatGrad
@ TexUnified1DArrayFloatFloatGrad
Definition: NVPTXISelLowering.h:187

llvm::NVPTXISD::Suld2DArrayV4I16Clamp
@ Suld2DArrayV4I16Clamp
Definition: NVPTXISelLowering.h:309

llvm::NVPTXISD::TexUnifiedCubeS32FloatGrad
@ TexUnifiedCubeS32FloatGrad
Definition: NVPTXISelLowering.h:245

llvm::NVPTXISD::Tld4B2DS64Float
@ Tld4B2DS64Float
Definition: NVPTXISelLowering.h:166

llvm::NVPTXISD::Suld1DI16Trap
@ Suld1DI16Trap
Definition: NVPTXISelLowering.h:325

llvm::NVPTXISD::Suld3DI16Clamp
@ Suld3DI16Clamp
Definition: NVPTXISelLowering.h:313

llvm::NVPTXISD::TexUnified1DS32S32
@ TexUnified1DS32S32
Definition: NVPTXISelLowering.h:176

llvm::NVPTXISD::Suld3DV2I8Zero
@ Suld3DV2I8Zero
Definition: NVPTXISelLowering.h:436

llvm::NVPTXISD::Tld4A2DS64Float
@ Tld4A2DS64Float
Definition: NVPTXISelLowering.h:167

llvm::NVPTXISD::Suld2DI64Clamp
@ Suld2DI64Clamp
Definition: NVPTXISelLowering.h:291

llvm::NVPTXISD::Tld4R2DS64Float
@ Tld4R2DS64Float
Definition: NVPTXISelLowering.h:164

llvm::NVPTXISD::Suld2DArrayV4I16Zero
@ Suld2DArrayV4I16Zero
Definition: NVPTXISelLowering.h:429

llvm::NVPTXISD::Suld1DV4I32Zero
@ Suld1DV4I32Zero
Definition: NVPTXISelLowering.h:394

llvm::NVPTXISD::Tex1DFloatS32
@ Tex1DFloatS32
Definition: NVPTXISelLowering.h:88

llvm::NVPTXISD::Tex3DS32Float
@ Tex3DS32Float
Definition: NVPTXISelLowering.h:141

llvm::NVPTXISD::TexUnified1DU32S32
@ TexUnified1DU32S32
Definition: NVPTXISelLowering.h:180

llvm::NVPTXISD::Suld3DV2I32Clamp
@ Suld3DV2I32Clamp
Definition: NVPTXISelLowering.h:318

llvm::NVPTXISD::Suld1DArrayV2I32Trap
@ Suld1DArrayV2I32Trap
Definition: NVPTXISelLowering.h:342

llvm::NVPTXISD::Suld2DI32Zero
@ Suld2DI32Zero
Definition: NVPTXISelLowering.h:410

llvm::NVPTXISD::Wrapper
@ Wrapper
Definition: NVPTXISelLowering.h:26

llvm::NVPTXISD::Suld1DArrayV2I8Zero
@ Suld1DArrayV2I8Zero
Definition: NVPTXISelLowering.h:400

llvm::NVPTXISD::Suld1DV2I16Zero
@ Suld1DV2I16Zero
Definition: NVPTXISelLowering.h:389

llvm::NVPTXISD::Suld3DV4I8Zero
@ Suld3DV4I8Zero
Definition: NVPTXISelLowering.h:440

llvm::NVPTXISD::TexCubeArrayU32FloatLevel
@ TexCubeArrayU32FloatLevel
Definition: NVPTXISelLowering.h:159

llvm::NVPTXISD::TexUnified3DS32FloatLevel
@ TexUnified3DS32FloatLevel
Definition: NVPTXISelLowering.h:226

llvm::NVPTXISD::Tld4A2DFloatFloat
@ Tld4A2DFloatFloat
Definition: NVPTXISelLowering.h:163

llvm::NVPTXISD::TexUnified3DU32S32
@ TexUnified3DU32S32
Definition: NVPTXISelLowering.h:228

llvm::NVPTXISD::Suld2DArrayI32Trap
@ Suld2DArrayI32Trap
Definition: NVPTXISelLowering.h:362

llvm::NVPTXISD::Suld3DI64Clamp
@ Suld3DI64Clamp
Definition: NVPTXISelLowering.h:315

llvm::NVPTXISD::Suld1DV4I16Clamp
@ Suld1DV4I16Clamp
Definition: NVPTXISelLowering.h:273

llvm::NVPTXISD::Suld2DV4I8Trap
@ Suld2DV4I8Trap
Definition: NVPTXISelLowering.h:356

llvm::NVPTXISD::Suld1DI32Zero
@ Suld1DI32Zero
Definition: NVPTXISelLowering.h:386

llvm::NVPTXISD::Suld2DV2I8Zero
@ Suld2DV2I8Zero
Definition: NVPTXISelLowering.h:412

llvm::NVPTXISD::SETP_BF16X2
@ SETP_BF16X2
Definition: NVPTXISelLowering.h:60

llvm::NVPTXISD::Tex2DArrayFloatS32
@ Tex2DArrayFloatS32
Definition: NVPTXISelLowering.h:124

llvm::NVPTXISD::Suld2DV2I32Zero
@ Suld2DV2I32Zero
Definition: NVPTXISelLowering.h:414

llvm::NVPTXISD::Suld2DV2I64Clamp
@ Suld2DV2I64Clamp
Definition: NVPTXISelLowering.h:295

llvm::NVPTXISD::Tex3DU32Float
@ Tex3DU32Float
Definition: NVPTXISelLowering.h:145

llvm::NVPTXISD::TexUnifiedCubeU32Float
@ TexUnifiedCubeU32Float
Definition: NVPTXISelLowering.h:236

llvm::NVPTXISD::Suld2DV2I16Trap
@ Suld2DV2I16Trap
Definition: NVPTXISelLowering.h:353

llvm::NVPTXISD::Suld2DV2I64Trap
@ Suld2DV2I64Trap
Definition: NVPTXISelLowering.h:355

llvm::NVPTXISD::Tex1DU32Float
@ Tex1DU32Float
Definition: NVPTXISelLowering.h:97

llvm::NVPTXISD::LDUV4
@ LDUV4
Definition: NVPTXISelLowering.h:72

llvm::NVPTXISD::Suld3DI32Zero
@ Suld3DI32Zero
Definition: NVPTXISelLowering.h:434

llvm::NVPTXISD::Suld3DV4I16Trap
@ Suld3DV4I16Trap
Definition: NVPTXISelLowering.h:381

llvm::NVPTXISD::Suld2DArrayV2I8Trap
@ Suld2DArrayV2I8Trap
Definition: NVPTXISelLowering.h:364

llvm::NVPTXISD::TexUnifiedCubeArrayS32FloatGrad
@ TexUnifiedCubeArrayS32FloatGrad
Definition: NVPTXISelLowering.h:248

llvm::NVPTXISD::Suld1DV4I8Zero
@ Suld1DV4I8Zero
Definition: NVPTXISelLowering.h:392

llvm::NVPTXISD::Suld3DV2I8Clamp
@ Suld3DV2I8Clamp
Definition: NVPTXISelLowering.h:316

llvm::NVPTXISD::Tex2DArrayU32S32
@ Tex2DArrayU32S32
Definition: NVPTXISelLowering.h:132

llvm::NVPTXISD::Tld4UnifiedA2DS64Float
@ Tld4UnifiedA2DS64Float
Definition: NVPTXISelLowering.h:257

llvm::NVPTXISD::Tex1DArrayU32FloatGrad
@ Tex1DArrayU32FloatGrad
Definition: NVPTXISelLowering.h:111

llvm::NVPTXISD::TexUnified2DArrayS32Float
@ TexUnified2DArrayS32Float
Definition: NVPTXISelLowering.h:213

llvm::NVPTXISD::Suld2DI8Zero
@ Suld2DI8Zero
Definition: NVPTXISelLowering.h:408

llvm::NVPTXISD::TexCubeArrayS32Float
@ TexCubeArrayS32Float
Definition: NVPTXISelLowering.h:156

llvm::NVPTXISD::Tex2DArrayFloatFloatGrad
@ Tex2DArrayFloatFloatGrad
Definition: NVPTXISelLowering.h:127

llvm::NVPTXISD::Suld3DV2I32Zero
@ Suld3DV2I32Zero
Definition: NVPTXISelLowering.h:438

llvm::NVPTXISD::Suld1DArrayI64Zero
@ Suld1DArrayI64Zero
Definition: NVPTXISelLowering.h:399

llvm::NVPTXISD::Suld1DI8Zero
@ Suld1DI8Zero
Definition: NVPTXISelLowering.h:384

llvm::NVPTXISD::StoreParam
@ StoreParam
Definition: NVPTXISelLowering.h:78

llvm::NVPTXISD::StoreParamU32
@ StoreParamU32
Definition: NVPTXISelLowering.h:82

llvm::NVPTXISD::TexUnifiedCubeArrayS32Float
@ TexUnifiedCubeArrayS32Float
Definition: NVPTXISelLowering.h:240

llvm::NVPTXISD::Suld3DV4I32Zero
@ Suld3DV4I32Zero
Definition: NVPTXISelLowering.h:442

llvm::NVPTXISD::TexUnified2DArrayS32FloatLevel
@ TexUnified2DArrayS32FloatLevel
Definition: NVPTXISelLowering.h:214

llvm::NVPTXISD::Suld2DArrayV2I16Trap
@ Suld2DArrayV2I16Trap
Definition: NVPTXISelLowering.h:365

llvm::NVPTXISD::Tex1DArrayS32FloatLevel
@ Tex1DArrayS32FloatLevel
Definition: NVPTXISelLowering.h:106

llvm::NVPTXISD::Suld1DArrayV4I32Zero
@ Suld1DArrayV4I32Zero
Definition: NVPTXISelLowering.h:406

llvm::NVPTXISD::Tex1DS32FloatGrad
@ Tex1DS32FloatGrad
Definition: NVPTXISelLowering.h:95

llvm::NVPTXISD::Suld1DArrayV2I16Trap
@ Suld1DArrayV2I16Trap
Definition: NVPTXISelLowering.h:341

llvm::NVPTXISD::Tex1DFloatFloatGrad
@ Tex1DFloatFloatGrad
Definition: NVPTXISelLowering.h:91

llvm::NVPTXISD::Suld2DArrayV2I64Zero
@ Suld2DArrayV2I64Zero
Definition: NVPTXISelLowering.h:427

llvm::NVPTXISD::Suld1DArrayV2I16Clamp
@ Suld1DArrayV2I16Clamp
Definition: NVPTXISelLowering.h:281

llvm::NVPTXISD::Suld3DV4I32Clamp
@ Suld3DV4I32Clamp
Definition: NVPTXISelLowering.h:322

llvm::NVPTXISD::Suld2DV4I8Clamp
@ Suld2DV4I8Clamp
Definition: NVPTXISelLowering.h:296

llvm::NVPTXISD::TexUnifiedCubeArrayU32FloatLevel
@ TexUnifiedCubeArrayU32FloatLevel
Definition: NVPTXISelLowering.h:243

llvm::NVPTXISD::Tex1DArrayFloatS32
@ Tex1DArrayFloatS32
Definition: NVPTXISelLowering.h:100

llvm::NVPTXISD::Tex3DS32FloatGrad
@ Tex3DS32FloatGrad
Definition: NVPTXISelLowering.h:143

llvm::NVPTXISD::TexUnified2DArrayS32S32
@ TexUnified2DArrayS32S32
Definition: NVPTXISelLowering.h:212

llvm::NVPTXISD::Suld2DArrayI8Zero
@ Suld2DArrayI8Zero
Definition: NVPTXISelLowering.h:420

llvm::NVPTXISD::Suld1DV2I16Trap
@ Suld1DV2I16Trap
Definition: NVPTXISelLowering.h:329

llvm::NVPTXISD::Tld4UnifiedB2DS64Float
@ Tld4UnifiedB2DS64Float
Definition: NVPTXISelLowering.h:256

llvm::NVPTXISD::Tex1DS32S32
@ Tex1DS32S32
Definition: NVPTXISelLowering.h:92

llvm::NVPTXISD::Suld1DI64Clamp
@ Suld1DI64Clamp
Definition: NVPTXISelLowering.h:267

llvm::NVPTXISD::TexUnified2DArrayFloatFloatGrad
@ TexUnified2DArrayFloatFloatGrad
Definition: NVPTXISelLowering.h:211

llvm::NVPTXISD::TexUnified3DFloatFloat
@ TexUnified3DFloatFloat
Definition: NVPTXISelLowering.h:221

llvm::NVPTXISD::Suld2DArrayV4I32Zero
@ Suld2DArrayV4I32Zero
Definition: NVPTXISelLowering.h:430

llvm::NVPTXISD::Tld4UnifiedR2DS64Float
@ Tld4UnifiedR2DS64Float
Definition: NVPTXISelLowering.h:254

llvm::NVPTXISD::Tld4G2DS64Float
@ Tld4G2DS64Float
Definition: NVPTXISelLowering.h:165

llvm::NVPTXISD::Suld1DI64Trap
@ Suld1DI64Trap
Definition: NVPTXISelLowering.h:327

llvm::NVPTXISD::TexUnifiedCubeU32FloatGrad
@ TexUnifiedCubeU32FloatGrad
Definition: NVPTXISelLowering.h:246

llvm::NVPTXISD::Tld4UnifiedB2DFloatFloat
@ Tld4UnifiedB2DFloatFloat
Definition: NVPTXISelLowering.h:252

llvm::NVPTXISD::TexUnified1DArrayU32FloatLevel
@ TexUnified1DArrayU32FloatLevel
Definition: NVPTXISelLowering.h:194

llvm::NVPTXISD::Suld3DI16Trap
@ Suld3DI16Trap
Definition: NVPTXISelLowering.h:373

llvm::NVPTXISD::Suld1DArrayV4I32Clamp
@ Suld1DArrayV4I32Clamp
Definition: NVPTXISelLowering.h:286

llvm::NVPTXISD::Suld1DArrayI16Trap
@ Suld1DArrayI16Trap
Definition: NVPTXISelLowering.h:337

llvm::NVPTXISD::TexUnified1DArrayS32FloatGrad
@ TexUnified1DArrayS32FloatGrad
Definition: NVPTXISelLowering.h:191

llvm::NVPTXISD::Suld3DV2I32Trap
@ Suld3DV2I32Trap
Definition: NVPTXISelLowering.h:378

llvm::NVPTXISD::Suld2DI64Trap
@ Suld2DI64Trap
Definition: NVPTXISelLowering.h:351

llvm::NVPTXISD::LDGV2
@ LDGV2
Definition: NVPTXISelLowering.h:69

llvm::NVPTXISD::Tex3DFloatFloat
@ Tex3DFloatFloat
Definition: NVPTXISelLowering.h:137

llvm::NVPTXISD::Suld1DArrayV2I8Clamp
@ Suld1DArrayV2I8Clamp
Definition: NVPTXISelLowering.h:280

llvm::NVPTXISD::Suld2DArrayI32Zero
@ Suld2DArrayI32Zero
Definition: NVPTXISelLowering.h:422

llvm::NVPTXISD::Tex1DFloatFloat
@ Tex1DFloatFloat
Definition: NVPTXISelLowering.h:89

llvm::NVPTXISD::Tld4UnifiedG2DU64Float
@ Tld4UnifiedG2DU64Float
Definition: NVPTXISelLowering.h:259

llvm::NVPTXISD::TexCubeArrayU32Float
@ TexCubeArrayU32Float
Definition: NVPTXISelLowering.h:158

llvm::NVPTXISD::Tex2DU32FloatLevel
@ Tex2DU32FloatLevel
Definition: NVPTXISelLowering.h:122

llvm::NVPTXISD::TexUnified2DS32FloatGrad
@ TexUnified2DS32FloatGrad
Definition: NVPTXISelLowering.h:203

llvm::NVPTXISD::TexUnified2DArrayS32FloatGrad
@ TexUnified2DArrayS32FloatGrad
Definition: NVPTXISelLowering.h:215

llvm::NVPTXISD::Suld2DV2I16Zero
@ Suld2DV2I16Zero
Definition: NVPTXISelLowering.h:413

llvm::NVPTXISD::Suld2DArrayI64Zero
@ Suld2DArrayI64Zero
Definition: NVPTXISelLowering.h:423

llvm::NVPTXISD::Suld1DV4I32Clamp
@ Suld1DV4I32Clamp
Definition: NVPTXISelLowering.h:274

llvm::NVPTXISD::TexUnified1DU32FloatLevel
@ TexUnified1DU32FloatLevel
Definition: NVPTXISelLowering.h:182

llvm::NVPTXISD::Tld4UnifiedA2DU64Float
@ Tld4UnifiedA2DU64Float
Definition: NVPTXISelLowering.h:261

llvm::NVPTXISD::Suld1DArrayI8Trap
@ Suld1DArrayI8Trap
Definition: NVPTXISelLowering.h:336

llvm::NVPTXISD::TexUnified2DFloatFloat
@ TexUnified2DFloatFloat
Definition: NVPTXISelLowering.h:197

llvm::NVPTXISD::Tex2DS32FloatLevel
@ Tex2DS32FloatLevel
Definition: NVPTXISelLowering.h:118

llvm::NVPTXISD::Suld3DI16Zero
@ Suld3DI16Zero
Definition: NVPTXISelLowering.h:433

llvm::NVPTXISD::Tex1DU32FloatGrad
@ Tex1DU32FloatGrad
Definition: NVPTXISelLowering.h:99

llvm::NVPTXISD::TexUnifiedCubeArrayU32Float
@ TexUnifiedCubeArrayU32Float
Definition: NVPTXISelLowering.h:242

llvm::NVPTXISD::Tld4B2DU64Float
@ Tld4B2DU64Float
Definition: NVPTXISelLowering.h:170

llvm::NVPTXISD::TexUnified3DS32S32
@ TexUnified3DS32S32
Definition: NVPTXISelLowering.h:224

llvm::NVPTXISD::Tex3DU32FloatGrad
@ Tex3DU32FloatGrad
Definition: NVPTXISelLowering.h:147

llvm::NVPTXISD::Suld2DV4I8Zero
@ Suld2DV4I8Zero
Definition: NVPTXISelLowering.h:416

llvm::NVPTXISD::TexUnified2DArrayFloatS32
@ TexUnified2DArrayFloatS32
Definition: NVPTXISelLowering.h:208

llvm::NVPTXISD::LoadV4
@ LoadV4
Definition: NVPTXISelLowering.h:68

llvm::NVPTXISD::Suld2DV4I16Clamp
@ Suld2DV4I16Clamp
Definition: NVPTXISelLowering.h:297

llvm::NVPTXISD::Tex2DS32S32
@ Tex2DS32S32
Definition: NVPTXISelLowering.h:116

llvm::NVPTXISD::Suld3DV4I8Trap
@ Suld3DV4I8Trap
Definition: NVPTXISelLowering.h:380

llvm::NVPTXISD::Suld1DV2I16Clamp
@ Suld1DV2I16Clamp
Definition: NVPTXISelLowering.h:269

llvm::NVPTXISD::TexUnified2DS32S32
@ TexUnified2DS32S32
Definition: NVPTXISelLowering.h:200

llvm::NVPTXISD::Suld3DV2I64Trap
@ Suld3DV2I64Trap
Definition: NVPTXISelLowering.h:379

llvm::NVPTXISD::TexUnified1DS32Float
@ TexUnified1DS32Float
Definition: NVPTXISelLowering.h:177

llvm::NVPTXISD::TexUnified1DArrayU32FloatGrad
@ TexUnified1DArrayU32FloatGrad
Definition: NVPTXISelLowering.h:195

llvm::NVPTXISD::Tex2DArrayS32S32
@ Tex2DArrayS32S32
Definition: NVPTXISelLowering.h:128

llvm::NVPTXISD::Suld1DV2I64Trap
@ Suld1DV2I64Trap
Definition: NVPTXISelLowering.h:331

llvm::NVPTXISD::LoadParam
@ LoadParam
Definition: NVPTXISelLowering.h:75

llvm::NVPTXISD::Suld2DArrayI32Clamp
@ Suld2DArrayI32Clamp
Definition: NVPTXISelLowering.h:302

llvm::NVPTXISD::Suld2DV2I16Clamp
@ Suld2DV2I16Clamp
Definition: NVPTXISelLowering.h:293

llvm::NVPTX::PTXCmpMode::CmpMode
CmpMode
Definition: NVPTX.h:159

llvm::NVPTX::PTXCmpMode::FTZ_FLAG
@ FTZ_FLAG
Definition: NVPTX.h:181

llvm::NVPTX::PTXCvtMode::NONE
@ NONE
Definition: NVPTX.h:139

llvm::NVPTX::PTXLdStInstCode::FromType
FromType
Definition: NVPTX.h:123

llvm::NVPTX::PTXLdStInstCode::Unsigned
@ Unsigned
Definition: NVPTX.h:124

llvm::NVPTX::PTXLdStInstCode::Signed
@ Signed
Definition: NVPTX.h:125

llvm::NVPTX::PTXLdStInstCode::Untyped
@ Untyped
Definition: NVPTX.h:127

llvm::NVPTX::PTXLdStInstCode::Float
@ Float
Definition: NVPTX.h:126

llvm::NVPTX::PTXLdStInstCode::PARAM
@ PARAM
Definition: NVPTX.h:120

llvm::NVPTX::PTXLdStInstCode::GENERIC
@ GENERIC
Definition: NVPTX.h:116

llvm::NVPTX::PTXLdStInstCode::SHARED
@ SHARED
Definition: NVPTX.h:119

llvm::NVPTX::PTXLdStInstCode::GLOBAL
@ GLOBAL
Definition: NVPTX.h:117

llvm::NVPTX::PTXLdStInstCode::LOCAL
@ LOCAL
Definition: NVPTX.h:121

llvm::NVPTX::PTXLdStInstCode::CONSTANT
@ CONSTANT
Definition: NVPTX.h:118

llvm::NVPTX::PTXLdStInstCode::VecType
VecType
Definition: NVPTX.h:129

llvm::NVPTX::PTXLdStInstCode::Scalar
@ Scalar
Definition: NVPTX.h:130

llvm::NVPTX::PTXLdStInstCode::V2
@ V2
Definition: NVPTX.h:131

llvm::NVPTX::PTXLdStInstCode::V4
@ V4
Definition: NVPTX.h:132

llvm::RISCVMatInt::Imm
@ Imm
Definition: RISCVMatInt.h:24

llvm::cl::Hidden
@ Hidden
Definition: CommandLine.h:138

llvm::cl::init
initializer< Ty > init(const Ty &Val)
Definition: CommandLine.h:450

llvm::codeview::EncodedFramePtrReg::BasePtr
@ BasePtr

llvm::jitlink::aarch64::PointerSize
constexpr uint64_t PointerSize
aarch64 pointer size.
Definition: aarch64.h:616

llvm::omp::RTLDependInfoFields::Len
@ Len

llvm::pdb::PDB_DataKind::Param
@ Param

llvm::sampleprof::Base
@ Base
Definition: Discriminator.h:58

llvm
This is an optimization pass for GlobalISel generic memory operations.
Definition: AddressRanges.h:18

llvm::drop_begin
auto drop_begin(T &&RangeOrContainer, size_t N=1)
Return a range covering RangeOrContainer with the first N elements excluded.
Definition: STLExtras.h:329

llvm::Offset
@ Offset
Definition: DWP.cpp:456

llvm::all_of
bool all_of(R &&range, UnaryPredicate P)
Provide wrappers to std::all_of which take ranges instead of having to pass begin/end explicitly.
Definition: STLExtras.h:1722

llvm::Isv2x16VT
bool Isv2x16VT(EVT VT)
Definition: NVPTXUtilities.cpp:364

llvm::isStrongerThanMonotonic
bool isStrongerThanMonotonic(AtomicOrdering AO)
Definition: AtomicOrdering.h:125

llvm::countr_one
int countr_one(T Value)
Count the number of ones from the least significant bit to the first zero bit.
Definition: bit.h:307

llvm::ADDRESS_SPACE_GENERIC
@ ADDRESS_SPACE_GENERIC
Definition: NVPTXBaseInfo.h:22

llvm::ADDRESS_SPACE_LOCAL
@ ADDRESS_SPACE_LOCAL
Definition: NVPTXBaseInfo.h:26

llvm::ADDRESS_SPACE_CONST
@ ADDRESS_SPACE_CONST
Definition: NVPTXBaseInfo.h:25

llvm::ADDRESS_SPACE_GLOBAL
@ ADDRESS_SPACE_GLOBAL
Definition: NVPTXBaseInfo.h:23

llvm::ADDRESS_SPACE_PARAM
@ ADDRESS_SPACE_PARAM
Definition: NVPTXBaseInfo.h:29

llvm::ADDRESS_SPACE_SHARED
@ ADDRESS_SPACE_SHARED
Definition: NVPTXBaseInfo.h:24

llvm::createNVPTXISelDag
FunctionPass * createNVPTXISelDag(NVPTXTargetMachine &TM, llvm::CodeGenOptLevel OptLevel)
createNVPTXISelDag - This pass converts a legalized DAG into a NVPTX-specific DAG,...
Definition: NVPTXISelDAGToDAG.cpp:39

llvm::countr_zero
int countr_zero(T Val)
Count number of 0's from the least significant bit to the most stopping at the first 1.
Definition: bit.h:215

llvm::isShiftedMask_64
constexpr bool isShiftedMask_64(uint64_t Value)
Return true if the argument contains a non-empty sequence of ones with the remainder zero (64 bit ver...
Definition: MathExtras.h:269

llvm::report_fatal_error
void report_fatal_error(Error Err, bool gen_crash_diag=true)
Report a serious error, calling any installed error handler.
Definition: Error.cpp:159

llvm::isMask_64
constexpr bool isMask_64(uint64_t Value)
Return true if the argument is a non-empty sequence of ones starting at the least significant bit wit...
Definition: MathExtras.h:257

llvm::CodeGenOptLevel
CodeGenOptLevel
Code generation optimization level.
Definition: CodeGen.h:54

llvm::CodeGenOptLevel::None
@ None
-O0

llvm::AtomicOrdering
AtomicOrdering
Atomic ordering for LLVM's memory model.
Definition: AtomicOrdering.h:56

llvm::AtomicOrdering::Monotonic
@ Monotonic

llvm::getUnderlyingObjects
void getUnderlyingObjects(const Value *V, SmallVectorImpl< const Value * > &Objects, LoopInfo *LI=nullptr, unsigned MaxLookup=6)
This method is similar to getUnderlyingObject except that it can look through phi and select instruct...
Definition: ValueTracking.cpp:6431

llvm::HighlightColor::Address
@ Address

llvm::isKernelFunction
bool isKernelFunction(const Function &F)
Definition: NVPTXUtilities.cpp:291

llvm::VFParamKind::Vector
@ Vector

std
Implement std::hash so that hash_code can be used in STL containers.
Definition: BitVector.h:858

std::swap
void swap(llvm::BitVector &LHS, llvm::BitVector &RHS)
Implement std::swap in terms of BitVector swap.
Definition: BitVector.h:860

raw_ostream.h

N
#define N

llvm::EVT
Extended Value Type.
Definition: ValueTypes.h:34

llvm::EVT::isSimple
bool isSimple() const
Test if the given EVT is simple (as opposed to being extended).
Definition: ValueTypes.h:136

llvm::EVT::isFloatingPoint
bool isFloatingPoint() const
Return true if this is a FP or a vector FP type.
Definition: ValueTypes.h:146

llvm::EVT::getSimpleVT
MVT getSimpleVT() const
Return the SimpleValueType held in the specified simple EVT.
Definition: ValueTypes.h:306

llvm::EVT::isVector
bool isVector() const
Return true if this is a vector value type.
Definition: ValueTypes.h:167

llvm::EVT::getVectorElementType
EVT getVectorElementType() const
Given a vector type, return the type of each element.
Definition: ValueTypes.h:318

llvm::EVT::getVectorNumElements
unsigned getVectorNumElements() const
Given a vector type, return the number of elements it contains.
Definition: ValueTypes.h:326

llvm::SDVTList
This represents a list of ValueType's that has been intern'd by a SelectionDAG.
Definition: SelectionDAGNodes.h:79

llvm::cl::desc
Definition: CommandLine.h:416