Index

_ | A | B | C | D | E | F | G | H | I | K | L | M | N | O | P | Q | R | S | T | U | V | W | Y | Z

_

__init__() (AcceptanceRateValidation method)

__new__() (LayerNormPositionType method)

A

B

C

D

E

F

G

H

I

K

L

M

m4n2_1d() (in module modelopt.torch.sparsity.magnitude)
MagnitudeSearcher (class in modelopt.torch.sparsity.magnitude)
make_causal_mask() (in module modelopt.torch.speculative.eagle.utils)
make_divisible() (in module modelopt.torch.utils.network)
make_gs_awq_scale() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_dequantize_node() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_dequantize_output() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_pre_quant_scale_node() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_pre_quant_scale_output() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_quantize_node() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_quantize_output() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_quantized_weight() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_scale() (in module modelopt.onnx.quantization.qdq_utils)
make_gs_zp() (in module modelopt.onnx.quantization.qdq_utils)
match() (in module modelopt.torch.utils.graph)
match_fp8_mha_pattern() (in module modelopt.onnx.quantization.graph_utils)
max (Hparam property)
max_beam_width (LLM property)
max_calibrate() (in module modelopt.torch.quantization.model_calib)
max_co_batch_size (AWQClipCalibConfig attribute)
max_degrade (BinarySearcher attribute)
max_depth (SymDepth property)
max_position_embeddings (DecoderLayerConfig attribute)
- (ModelConfig property)
max_seq_len (LLM property)
max_tokens_per_batch (AWQClipCalibConfig attribute)
maxbound (TensorQuantizer property)
MaxCalibrator (class in modelopt.torch.quantization.calib.max)
MaxPool1d (in module modelopt.torch.quantization.nn.modules.quant_pooling)
MaxPool2d (in module modelopt.torch.quantization.nn.modules.quant_pooling)
MaxPool3d (in module modelopt.torch.quantization.nn.modules.quant_pooling)
medusa_heads (ModelConfig attribute)
medusa_layers (MedusaHeadConfig attribute)
medusa_num_heads (MedusaConfig attribute)
medusa_num_layers (MedusaConfig attribute)
MedusaHeadConfig (class in modelopt.torch.export.model_config)
MedusaModeDescriptor (class in modelopt.torch.speculative.mode)
MedusaModel (class in modelopt.torch.speculative.medusa.medusa_model)
merge_gate_fc (MLPConfig attribute)
merge_gate_fc() (in module modelopt.torch.export.model_config_utils)
merge_qkv() (in module modelopt.torch.export.model_config_utils)
method (AWQClipCalibConfig attribute)
- (AWQFullCalibConfig attribute)
- (AWQLiteCalibConfig attribute)
- (MaxCalibConfig attribute)
- (QuantizeAlgorithmConfig attribute)
- (SmoothQuantCalibConfig attribute)
- (SVDQuantConfig attribute)
MGDLoss (class in modelopt.torch.distill.losses)
middle_value (BinarySearcher attribute)
min (Hparam property)
min_clip_ratio (AWQClipCalibConfig attribute)
min_degrade (BinarySearcher attribute)
min_depth (SymDepth property)
MllamaImageProcessor (class in modelopt.torch.utils.image_processor)
mlp (DecoderLayerConfig attribute)
MLP (MLPType attribute)
mlp_layernorm (DecoderLayerConfig attribute)
mlp_replacing_linear (DecoderLayerConfig attribute)
MLPConfig (class in modelopt.torch.export.model_config)
MLPType (class in modelopt.torch.export.tensorrt_llm_type)
mn_1d_best() (in module modelopt.torch.sparsity.magnitude)
ModeDescriptor (class in modelopt.torch.opt.mode)
model (BaseSearcher attribute)
model_config_from_dict() (in module modelopt.torch.export.model_config_utils)
model_config_to_dict() (in module modelopt.torch.export.model_config_utils)
model_dump() (KDLossConfig method)
- (ModeloptBaseConfig method)
model_dump_json() (ModeloptBaseConfig method)
model_to() (in module modelopt.torch.utils.network)
model_type_is_enc_dec() (in module modelopt.torch.export.layer_utils)
ModelConfig (class in modelopt.torch.export.model_config)
modelopt.deploy
- module
modelopt.deploy.llm
- module
modelopt.deploy.llm.generate
- module
modelopt.deploy.llm.nemo_utils
- module
modelopt.onnx
- module
modelopt.onnx.autocast
- module
modelopt.onnx.autocast.convert
- module
modelopt.onnx.autocast.graphsanitizer
- module
modelopt.onnx.autocast.logging_config
- module
modelopt.onnx.autocast.nodeclassifier
- module
modelopt.onnx.autocast.precisionconverter
- module
modelopt.onnx.autocast.referencerunner
- module
modelopt.onnx.autocast.utils
- module
modelopt.onnx.logging_config
- module
modelopt.onnx.op_types
- module
modelopt.onnx.quantization
- module
modelopt.onnx.quantization.calib_utils
- module
modelopt.onnx.quantization.extensions
- module
modelopt.onnx.quantization.fp8
- module
modelopt.onnx.quantization.graph_utils
- module
modelopt.onnx.quantization.gs_patching
- module
modelopt.onnx.quantization.int4
- module
modelopt.onnx.quantization.int8
- module
modelopt.onnx.quantization.operators
- module
modelopt.onnx.quantization.ort_patching
- module
modelopt.onnx.quantization.ort_utils
- module
modelopt.onnx.quantization.partitioning
- module
modelopt.onnx.quantization.qdq_utils
- module
modelopt.onnx.quantization.quant_utils
- module
modelopt.onnx.trt_utils
- module
modelopt.onnx.utils
- module
modelopt.torch
- module
modelopt.torch.distill
- module
modelopt.torch.distill.config
- module
modelopt.torch.distill.distillation
- module
modelopt.torch.distill.distillation_model
- module
modelopt.torch.distill.loss_balancers
- module
modelopt.torch.distill.losses
- module
modelopt.torch.distill.mode
- module
modelopt.torch.distill.plugins
- module
modelopt.torch.distill.registry
- module
modelopt.torch.export
- module
modelopt.torch.export.convert_hf_config
- module
modelopt.torch.export.distribute
- module
modelopt.torch.export.hf_config_map
- module
modelopt.torch.export.layer_utils
- module
modelopt.torch.export.mcore_config_map
- module
modelopt.torch.export.model_config
- module
modelopt.torch.export.model_config_export
- module
modelopt.torch.export.model_config_utils
- module
modelopt.torch.export.model_utils
- module
modelopt.torch.export.plugins
- module
modelopt.torch.export.postprocess
- module
modelopt.torch.export.quant_utils
- module
modelopt.torch.export.tensorrt_llm_type
- module
modelopt.torch.export.tensorrt_llm_utils
- module
modelopt.torch.export.transformer_engine
- module
modelopt.torch.export.unified_export_hf
- module
modelopt.torch.export.unified_export_megatron
- module
modelopt.torch.nas
- module
modelopt.torch.nas.algorithms
- module
modelopt.torch.nas.autonas
- module
modelopt.torch.nas.conversion
- module
modelopt.torch.nas.hparams
- module
modelopt.torch.nas.hparams.concat
- module
modelopt.torch.nas.hparams.container
- module
modelopt.torch.nas.modules
- module
modelopt.torch.nas.modules.container
- module
modelopt.torch.nas.modules.conv
- module
modelopt.torch.nas.modules.linear
- module
modelopt.torch.nas.modules.norm
- module
modelopt.torch.nas.modules.utils
- module
modelopt.torch.nas.patch
- module
modelopt.torch.nas.plugins
- module
modelopt.torch.nas.registry
- module
modelopt.torch.nas.search_space
- module
modelopt.torch.nas.traced_hp
- module
modelopt.torch.nas.utils
- module
modelopt.torch.opt
- module
modelopt.torch.opt.config
- module
modelopt.torch.opt.conversion
- module
modelopt.torch.opt.dynamic
- module
modelopt.torch.opt.hparam
- module
modelopt.torch.opt.mode
- module
modelopt.torch.opt.plugins
- module
modelopt.torch.opt.plugins.huggingface
- module
modelopt.torch.opt.searcher
- module
modelopt.torch.opt.utils
- module
modelopt.torch.prune
- module
modelopt.torch.prune.fastnas
- module
modelopt.torch.prune.gradnas
- module
modelopt.torch.prune.plugins
- module
modelopt.torch.prune.pruning
- module
modelopt.torch.quantization
- module
modelopt.torch.quantization.backends
- module
modelopt.torch.quantization.backends.utils
- module
modelopt.torch.quantization.calib
- module
modelopt.torch.quantization.calib.bias
- module
modelopt.torch.quantization.calib.calibrator
- module
modelopt.torch.quantization.calib.histogram
- module
modelopt.torch.quantization.calib.max
- module
modelopt.torch.quantization.config
- module
modelopt.torch.quantization.conversion
- module
modelopt.torch.quantization.export_onnx
- module
modelopt.torch.quantization.extensions
- module
modelopt.torch.quantization.mode
- module
modelopt.torch.quantization.model_calib
- module
modelopt.torch.quantization.model_quant
- module
modelopt.torch.quantization.nn
- module
modelopt.torch.quantization.nn.functional
- module
modelopt.torch.quantization.nn.modules
- module
modelopt.torch.quantization.nn.modules.quant_activations
- module
modelopt.torch.quantization.nn.modules.quant_batchnorm
- module
modelopt.torch.quantization.nn.modules.quant_conv
- module
modelopt.torch.quantization.nn.modules.quant_instancenorm
- module
modelopt.torch.quantization.nn.modules.quant_linear
- module
modelopt.torch.quantization.nn.modules.quant_module
- module
modelopt.torch.quantization.nn.modules.quant_pooling
- module
modelopt.torch.quantization.nn.modules.quant_rnn
- module
modelopt.torch.quantization.nn.modules.tensor_quantizer
- module
modelopt.torch.quantization.plugins
- module
modelopt.torch.quantization.qtensor
- module
modelopt.torch.quantization.qtensor.base_qtensor
- module
modelopt.torch.quantization.qtensor.fp8_tensor
- module
modelopt.torch.quantization.qtensor.int4_tensor
- module
modelopt.torch.quantization.qtensor.int8_tensor
- module

modelopt.torch.quantization.qtensor.mxfp4_tensor
- module
modelopt.torch.quantization.qtensor.nf4_tensor
- module
modelopt.torch.quantization.tensor_quant
- module
modelopt.torch.quantization.triton
- module
modelopt.torch.quantization.triton.fp4_kernel
- module
modelopt.torch.quantization.utils
- module
modelopt.torch.sparsity
- module
modelopt.torch.sparsity.config
- module
modelopt.torch.sparsity.magnitude
- module
modelopt.torch.sparsity.mode
- module
modelopt.torch.sparsity.module
- module
modelopt.torch.sparsity.plugins
- module
modelopt.torch.sparsity.searcher
- module
modelopt.torch.sparsity.sparsegpt
- module
modelopt.torch.sparsity.sparsification
- module
modelopt.torch.speculative
- module
modelopt.torch.speculative.config
- module
modelopt.torch.speculative.eagle
- module
modelopt.torch.speculative.eagle.conversion
- module
modelopt.torch.speculative.eagle.eagle_model
- module
modelopt.torch.speculative.eagle.utils
- module
modelopt.torch.speculative.medusa
- module
modelopt.torch.speculative.medusa.conversion
- module
modelopt.torch.speculative.medusa.medusa_model
- module
modelopt.torch.speculative.mode
- module
modelopt.torch.speculative.mtp
- module
modelopt.torch.speculative.mtp.conversion
- module
modelopt.torch.speculative.mtp.mtp_model
- module
modelopt.torch.speculative.mtp.utils
- module
modelopt.torch.speculative.plugins
- module
modelopt.torch.speculative.speculative_decoding
- module
modelopt.torch.speculative.utils
- module
modelopt.torch.trace
- module
modelopt.torch.trace.analyzer
- module
modelopt.torch.trace.modules
- module
modelopt.torch.trace.modules.concat
- module
modelopt.torch.trace.modules.nn
- module
modelopt.torch.trace.plugins
- module
modelopt.torch.trace.symbols
- module
modelopt.torch.trace.tracer
- module
modelopt.torch.utils
- module
modelopt.torch.utils.cpp_extension
- module
modelopt.torch.utils.dataset_utils
- module
modelopt.torch.utils.distributed
- module
modelopt.torch.utils.graph
- module
modelopt.torch.utils.image_processor
- module
modelopt.torch.utils.import_utils
- module
modelopt.torch.utils.list
- module
modelopt.torch.utils.logging
- module
modelopt.torch.utils.memory_monitor
- module
modelopt.torch.utils.network
- module
modelopt.torch.utils.perf
- module
modelopt.torch.utils.random
- module
modelopt.torch.utils.speech_dataset_utils
- module
modelopt.torch.utils.tensor
- module
modelopt.torch.utils.vlm_dataset_utils
- module
modelopt_post_restore() (QuantModule method)
modelopt_state() (in module modelopt.torch.opt.conversion)
ModeloptField() (in module modelopt.torch.opt.config)
ModeloptStateManager (class in modelopt.torch.opt.conversion)
modes_with_states() (ModeloptStateManager method)
modify() (DistillationModel method)
- (DynamicModule method)
- (EagleModel method)
- (MedusaModel method)
- (MTPModel method)
- (SparseModule method)
module
- modelopt.deploy
- modelopt.deploy.llm
- modelopt.deploy.llm.generate
- modelopt.deploy.llm.nemo_utils
- modelopt.onnx
- modelopt.onnx.autocast
- modelopt.onnx.autocast.convert
- modelopt.onnx.autocast.graphsanitizer
- modelopt.onnx.autocast.logging_config
- modelopt.onnx.autocast.nodeclassifier
- modelopt.onnx.autocast.precisionconverter
- modelopt.onnx.autocast.referencerunner
- modelopt.onnx.autocast.utils
- modelopt.onnx.logging_config
- modelopt.onnx.op_types
- modelopt.onnx.quantization
- modelopt.onnx.quantization.calib_utils
- modelopt.onnx.quantization.extensions
- modelopt.onnx.quantization.fp8
- modelopt.onnx.quantization.graph_utils
- modelopt.onnx.quantization.gs_patching
- modelopt.onnx.quantization.int4
- modelopt.onnx.quantization.int8
- modelopt.onnx.quantization.operators
- modelopt.onnx.quantization.ort_patching
- modelopt.onnx.quantization.ort_utils
- modelopt.onnx.quantization.partitioning
- modelopt.onnx.quantization.qdq_utils
- modelopt.onnx.quantization.quant_utils
- modelopt.onnx.trt_utils
- modelopt.onnx.utils
- modelopt.torch
- modelopt.torch.distill
- modelopt.torch.distill.config
- modelopt.torch.distill.distillation
- modelopt.torch.distill.distillation_model
- modelopt.torch.distill.loss_balancers
- modelopt.torch.distill.losses
- modelopt.torch.distill.mode
- modelopt.torch.distill.plugins
- modelopt.torch.distill.registry
- modelopt.torch.export
- modelopt.torch.export.convert_hf_config
- modelopt.torch.export.distribute
- modelopt.torch.export.hf_config_map
- modelopt.torch.export.layer_utils
- modelopt.torch.export.mcore_config_map
- modelopt.torch.export.model_config
- modelopt.torch.export.model_config_export
- modelopt.torch.export.model_config_utils
- modelopt.torch.export.model_utils
- modelopt.torch.export.plugins
- modelopt.torch.export.postprocess
- modelopt.torch.export.quant_utils
- modelopt.torch.export.tensorrt_llm_type
- modelopt.torch.export.tensorrt_llm_utils
- modelopt.torch.export.transformer_engine
- modelopt.torch.export.unified_export_hf
- modelopt.torch.export.unified_export_megatron
- modelopt.torch.nas
- modelopt.torch.nas.algorithms
- modelopt.torch.nas.autonas
- modelopt.torch.nas.conversion
- modelopt.torch.nas.hparams
- modelopt.torch.nas.hparams.concat
- modelopt.torch.nas.hparams.container
- modelopt.torch.nas.modules
- modelopt.torch.nas.modules.container
- modelopt.torch.nas.modules.conv
- modelopt.torch.nas.modules.linear
- modelopt.torch.nas.modules.norm
- modelopt.torch.nas.modules.utils
- modelopt.torch.nas.patch
- modelopt.torch.nas.plugins
- modelopt.torch.nas.registry
- modelopt.torch.nas.search_space
- modelopt.torch.nas.traced_hp
- modelopt.torch.nas.utils
- modelopt.torch.opt
- modelopt.torch.opt.config
- modelopt.torch.opt.conversion
- modelopt.torch.opt.dynamic
- modelopt.torch.opt.hparam
- modelopt.torch.opt.mode
- modelopt.torch.opt.plugins
- modelopt.torch.opt.plugins.huggingface
- modelopt.torch.opt.searcher
- modelopt.torch.opt.utils
- modelopt.torch.prune
- modelopt.torch.prune.fastnas
- modelopt.torch.prune.gradnas
- modelopt.torch.prune.plugins
- modelopt.torch.prune.pruning
- modelopt.torch.quantization
- modelopt.torch.quantization.backends
- modelopt.torch.quantization.backends.utils
- modelopt.torch.quantization.calib
- modelopt.torch.quantization.calib.bias
- modelopt.torch.quantization.calib.calibrator
- modelopt.torch.quantization.calib.histogram
- modelopt.torch.quantization.calib.max
- modelopt.torch.quantization.config
- modelopt.torch.quantization.conversion
- modelopt.torch.quantization.export_onnx
- modelopt.torch.quantization.extensions
- modelopt.torch.quantization.mode
- modelopt.torch.quantization.model_calib
- modelopt.torch.quantization.model_quant
- modelopt.torch.quantization.nn
- modelopt.torch.quantization.nn.functional
- modelopt.torch.quantization.nn.modules
- modelopt.torch.quantization.nn.modules.quant_activations
- modelopt.torch.quantization.nn.modules.quant_batchnorm
- modelopt.torch.quantization.nn.modules.quant_conv
- modelopt.torch.quantization.nn.modules.quant_instancenorm
- modelopt.torch.quantization.nn.modules.quant_linear
- modelopt.torch.quantization.nn.modules.quant_module
- modelopt.torch.quantization.nn.modules.quant_pooling
- modelopt.torch.quantization.nn.modules.quant_rnn
- modelopt.torch.quantization.nn.modules.tensor_quantizer
- modelopt.torch.quantization.plugins
- modelopt.torch.quantization.qtensor
- modelopt.torch.quantization.qtensor.base_qtensor
- modelopt.torch.quantization.qtensor.fp8_tensor
- modelopt.torch.quantization.qtensor.int4_tensor
- modelopt.torch.quantization.qtensor.int8_tensor
- modelopt.torch.quantization.qtensor.mxfp4_tensor
- modelopt.torch.quantization.qtensor.nf4_tensor
- modelopt.torch.quantization.tensor_quant
- modelopt.torch.quantization.triton
- modelopt.torch.quantization.triton.fp4_kernel
- modelopt.torch.quantization.utils
- modelopt.torch.sparsity
- modelopt.torch.sparsity.config
- modelopt.torch.sparsity.magnitude
- modelopt.torch.sparsity.mode
- modelopt.torch.sparsity.module
- modelopt.torch.sparsity.plugins
- modelopt.torch.sparsity.searcher
- modelopt.torch.sparsity.sparsegpt
- modelopt.torch.sparsity.sparsification
- modelopt.torch.speculative
- modelopt.torch.speculative.config
- modelopt.torch.speculative.eagle
- modelopt.torch.speculative.eagle.conversion
- modelopt.torch.speculative.eagle.eagle_model
- modelopt.torch.speculative.eagle.utils
- modelopt.torch.speculative.medusa
- modelopt.torch.speculative.medusa.conversion
- modelopt.torch.speculative.medusa.medusa_model
- modelopt.torch.speculative.mode
- modelopt.torch.speculative.mtp
- modelopt.torch.speculative.mtp.conversion
- modelopt.torch.speculative.mtp.mtp_model
- modelopt.torch.speculative.mtp.utils
- modelopt.torch.speculative.plugins
- modelopt.torch.speculative.speculative_decoding
- modelopt.torch.speculative.utils
- modelopt.torch.trace
- modelopt.torch.trace.analyzer
- modelopt.torch.trace.modules
- modelopt.torch.trace.modules.concat
- modelopt.torch.trace.modules.nn
- modelopt.torch.trace.plugins
- modelopt.torch.trace.symbols
- modelopt.torch.trace.tracer
- modelopt.torch.utils
- modelopt.torch.utils.cpp_extension
- modelopt.torch.utils.dataset_utils
- modelopt.torch.utils.distributed
- modelopt.torch.utils.graph
- modelopt.torch.utils.image_processor
- modelopt.torch.utils.import_utils
- modelopt.torch.utils.list
- modelopt.torch.utils.logging
- modelopt.torch.utils.memory_monitor
- modelopt.torch.utils.network
- modelopt.torch.utils.perf
- modelopt.torch.utils.random
- modelopt.torch.utils.speech_dataset_utils
- modelopt.torch.utils.tensor
- modelopt.torch.utils.vlm_dataset_utils
moe_num_experts (DecoderLayerConfig attribute)
moe_renorm_mode (DecoderLayerConfig attribute)
moe_top_k (DecoderLayerConfig attribute)
moe_tp_mode (DecoderLayerConfig attribute)
MOEConfig (class in modelopt.torch.export.model_config)
monitor_interval (GPUMemoryMonitor attribute)
monitor_thread (GPUMemoryMonitor attribute)
mopt_ckpt_versn (QuantModule property)
- (TensorQuantizer property)
mtp_freeze_list (MTPConfig attribute)
mtp_num_layers (MTPConfig attribute)
mtp_num_module (MTPConfig attribute)
MTPModeDescriptor (class in modelopt.torch.speculative.mode)
MTPModel (class in modelopt.torch.speculative.mtp.mtp_model)
mup_attn_multiplier (DecoderLayerConfig attribute)
mup_embedding_multiplier (DecoderLayerConfig attribute)
mup_use_scaling (DecoderLayerConfig attribute)
mup_width_multiplier (DecoderLayerConfig attribute)
MXFP4QTensor (class in modelopt.torch.quantization.qtensor.mxfp4_tensor)