qwen2_model_descriptor

Qwen2 model descriptor for AnyModel compression.

Classes

`Qwen2ModelDescriptor`	Model descriptor for Qwen2 models.
`Qwen2FFNIntermediateLayerDescriptor`	Layer descriptor for Qwen2 FFN intermediate pruning.

class Qwen2FFNIntermediateLayerDescriptor

Bases: LlamaFFNIntermediateLayerDescriptor

Layer descriptor for Qwen2 FFN intermediate pruning.

Qwen2 uses the same FFN structure as Llama (gate_proj, up_proj, down_proj).

__init__(down_proj_name='mlp.down_proj', ffn_prefix_name='model.layers.{layer_idx}.mlp', linear_weight_names=<factory>)

Parameters:

Return type:

None

class Qwen2ModelDescriptor

Bases: ModelDescriptor

Model descriptor for Qwen2 models.

static attn_no_op_post_init(decoder_layer)

static block_config_to_layer_overrides(block_config)

classmethod create_dummy_block(original_layer, block_index)

Create a dummy block that preserves Qwen2-specific attributes like attention_type.

Qwen2’s forward pass accesses decoder_layer.attention_type for attention mask selection.

Parameters:

Return type:

Module

static init_rotary_embedding(model, runtime)

static layer_block_name(index)

static layer_name_predicates(num_layers)

static mlp_no_op_post_init(decoder_layer)