program(1.0) [buildInfo = dict, tensor>({{"coremlc-component-MIL", "3520.4.1"}, {"coremlc-version", "3520.5.1"}, {"coremltools-component-torch", "2.11.0"}, {"coremltools-source-dialect", "TorchScript"}, {"coremltools-version", "8.3.0"}})] { func main(tensor embedding, tensor features, tensor sigma, tensor x_noisy) { tensor var_25 = const()[name = tensor("op_25"), val = tensor([-1, 1, 1])]; tensor sigma_to_fp16_dtype_0 = const()[name = tensor("sigma_to_fp16_dtype_0"), val = tensor("fp16")]; tensor sigma_to_fp16 = cast(dtype = sigma_to_fp16_dtype_0, x = sigma)[name = tensor("cast_27")]; tensor s_cast_fp16 = reshape(shape = var_25, x = sigma_to_fp16)[name = tensor("s_cast_fp16")]; tensor var_27_cast_fp16 = mul(x = s_cast_fp16, y = s_cast_fp16)[name = tensor("op_27_cast_fp16")]; tensor var_29_to_fp16 = const()[name = tensor("op_29_to_fp16"), val = tensor(0x1.47cp-5)]; tensor var_30_cast_fp16 = add(x = var_27_cast_fp16, y = var_29_to_fp16)[name = tensor("op_30_cast_fp16")]; tensor var_31_epsilon_0 = const()[name = tensor("op_31_epsilon_0"), val = tensor(0x1.a36e2ep-14)]; tensor var_31_cast_fp16 = inverse(epsilon = var_31_epsilon_0, x = var_30_cast_fp16)[name = tensor("op_31_cast_fp16")]; tensor var_32_to_fp16 = const()[name = tensor("op_32_to_fp16"), val = tensor(0x1.47cp-5)]; tensor c_skip_cast_fp16 = mul(x = var_31_cast_fp16, y = var_32_to_fp16)[name = tensor("c_skip_cast_fp16")]; tensor var_34_to_fp16 = const()[name = tensor("op_34_to_fp16"), val = tensor(0x1.998p-3)]; tensor var_35_cast_fp16 = mul(x = s_cast_fp16, y = var_34_to_fp16)[name = tensor("op_35_cast_fp16")]; tensor var_40_cast_fp16 = sqrt(x = var_30_cast_fp16)[name = tensor("op_40_cast_fp16")]; tensor c_out_cast_fp16 = real_div(x = var_35_cast_fp16, y = var_40_cast_fp16)[name = tensor("c_out_cast_fp16")]; tensor var_47_epsilon_0 = const()[name = tensor("op_47_epsilon_0"), val = tensor(0x1.a36e2ep-14)]; tensor var_47_cast_fp16 = inverse(epsilon = var_47_epsilon_0, x = var_40_cast_fp16)[name = tensor("op_47_cast_fp16")]; tensor var_50_epsilon_0 = const()[name = tensor("op_50_epsilon_0"), val = tensor(0x1p-149)]; tensor var_50_cast_fp16 = log(epsilon = var_50_epsilon_0, x = sigma_to_fp16)[name = tensor("op_50_cast_fp16")]; tensor var_51_to_fp16 = const()[name = tensor("op_51_to_fp16"), val = tensor(0x1p-2)]; tensor x_1_cast_fp16 = mul(x = var_50_cast_fp16, y = var_51_to_fp16)[name = tensor("x_1_cast_fp16")]; tensor x_noisy_to_fp16_dtype_0 = const()[name = tensor("x_noisy_to_fp16_dtype_0"), val = tensor("fp16")]; tensor x_noisy_to_fp16 = cast(dtype = x_noisy_to_fp16_dtype_0, x = x_noisy)[name = tensor("cast_26")]; tensor x_11_cast_fp16 = mul(x = var_47_cast_fp16, y = x_noisy_to_fp16)[name = tensor("x_11_cast_fp16")]; tensor var_55 = const()[name = tensor("op_55"), val = tensor(-1)]; tensor var_67 = const()[name = tensor("op_67"), val = tensor([1, 1])]; tensor x_5_cast_fp16 = reshape(shape = var_67, x = x_1_cast_fp16)[name = tensor("x_5_cast_fp16")]; tensor var_75_to_fp16 = const()[name = tensor("op_75_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(64)))]; tensor var_76_cast_fp16 = mul(x = x_5_cast_fp16, y = var_75_to_fp16)[name = tensor("op_76_cast_fp16")]; tensor var_77_promoted_to_fp16 = const()[name = tensor("op_77_promoted_to_fp16"), val = tensor(0x1p+1)]; tensor var_78_cast_fp16 = mul(x = var_76_cast_fp16, y = var_77_promoted_to_fp16)[name = tensor("op_78_cast_fp16")]; tensor var_79_to_fp16 = const()[name = tensor("op_79_to_fp16"), val = tensor(0x1.92p+1)]; tensor freqs_cast_fp16 = mul(x = var_78_cast_fp16, y = var_79_to_fp16)[name = tensor("freqs_cast_fp16")]; tensor var_81_cast_fp16 = sin(x = freqs_cast_fp16)[name = tensor("op_81_cast_fp16")]; tensor var_82_cast_fp16 = cos(x = freqs_cast_fp16)[name = tensor("op_82_cast_fp16")]; tensor input_1_interleave_0 = const()[name = tensor("input_1_interleave_0"), val = tensor(false)]; tensor input_1_cast_fp16 = concat(axis = var_55, interleave = input_1_interleave_0, values = (x_5_cast_fp16, var_81_cast_fp16, var_82_cast_fp16))[name = tensor("input_1_cast_fp16")]; tensor transformer_to_time_0_1_weight_to_fp16 = const()[name = tensor("transformer_to_time_0_1_weight_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(384)))]; tensor transformer_to_time_0_1_bias_to_fp16 = const()[name = tensor("transformer_to_time_0_1_bias_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(526784)))]; tensor linear_0_cast_fp16 = linear(bias = transformer_to_time_0_1_bias_to_fp16, weight = transformer_to_time_0_1_weight_to_fp16, x = input_1_cast_fp16)[name = tensor("linear_0_cast_fp16")]; tensor var_88_mode_0 = const()[name = tensor("op_88_mode_0"), val = tensor("EXACT")]; tensor var_88_cast_fp16 = gelu(mode = var_88_mode_0, x = linear_0_cast_fp16)[name = tensor("op_88_cast_fp16")]; tensor features_to_fp16_dtype_0 = const()[name = tensor("features_to_fp16_dtype_0"), val = tensor("fp16")]; tensor transformer_to_features_0_weight_to_fp16 = const()[name = tensor("transformer_to_features_0_weight_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(528896)))]; tensor transformer_to_features_0_bias_to_fp16 = const()[name = tensor("transformer_to_features_0_bias_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(1053248)))]; tensor features_to_fp16 = cast(dtype = features_to_fp16_dtype_0, x = features)[name = tensor("cast_25")]; tensor linear_1_cast_fp16 = linear(bias = transformer_to_features_0_bias_to_fp16, weight = transformer_to_features_0_weight_to_fp16, x = features_to_fp16)[name = tensor("linear_1_cast_fp16")]; tensor var_94_mode_0 = const()[name = tensor("op_94_mode_0"), val = tensor("EXACT")]; tensor var_94_cast_fp16 = gelu(mode = var_94_mode_0, x = linear_1_cast_fp16)[name = tensor("op_94_cast_fp16")]; tensor x_7_axis_0 = const()[name = tensor("x_7_axis_0"), val = tensor(0)]; tensor x_7_cast_fp16 = stack(axis = x_7_axis_0, values = (var_88_cast_fp16, var_94_cast_fp16))[name = tensor("x_7_cast_fp16")]; tensor var_101 = const()[name = tensor("op_101"), val = tensor([1, 2, 0])]; tensor input_7_axes_0 = const()[name = tensor("input_7_axes_0"), val = tensor([2])]; tensor input_7_keep_dims_0 = const()[name = tensor("input_7_keep_dims_0"), val = tensor(false)]; tensor x_9_cast_fp16 = transpose(perm = var_101, x = x_7_cast_fp16)[name = tensor("transpose_41")]; tensor input_7_cast_fp16 = reduce_sum(axes = input_7_axes_0, keep_dims = input_7_keep_dims_0, x = x_9_cast_fp16)[name = tensor("input_7_cast_fp16")]; tensor transformer_to_mapping_0_weight_to_fp16 = const()[name = tensor("transformer_to_mapping_0_weight_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(1055360)))]; tensor transformer_to_mapping_0_bias_to_fp16 = const()[name = tensor("transformer_to_mapping_0_bias_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(3152576)))]; tensor linear_2_cast_fp16 = linear(bias = transformer_to_mapping_0_bias_to_fp16, weight = transformer_to_mapping_0_weight_to_fp16, x = input_7_cast_fp16)[name = tensor("linear_2_cast_fp16")]; tensor input_11_mode_0 = const()[name = tensor("input_11_mode_0"), val = tensor("EXACT")]; tensor input_11_cast_fp16 = gelu(mode = input_11_mode_0, x = linear_2_cast_fp16)[name = tensor("input_11_cast_fp16")]; tensor transformer_to_mapping_2_weight_to_fp16 = const()[name = tensor("transformer_to_mapping_2_weight_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(3154688)))]; tensor transformer_to_mapping_2_bias_to_fp16 = const()[name = tensor("transformer_to_mapping_2_bias_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(5251904)))]; tensor linear_3_cast_fp16 = linear(bias = transformer_to_mapping_2_bias_to_fp16, weight = transformer_to_mapping_2_weight_to_fp16, x = input_11_cast_fp16)[name = tensor("linear_3_cast_fp16")]; tensor mapping_1_mode_0 = const()[name = tensor("mapping_1_mode_0"), val = tensor("EXACT")]; tensor mapping_1_cast_fp16 = gelu(mode = mapping_1_mode_0, x = linear_3_cast_fp16)[name = tensor("mapping_1_cast_fp16")]; tensor var_127_reps_0 = const()[name = tensor("op_127_reps_0"), val = tensor([1, 512, 1])]; tensor var_127_cast_fp16 = tile(reps = var_127_reps_0, x = x_11_cast_fp16)[name = tensor("op_127_cast_fp16")]; tensor var_129 = const()[name = tensor("op_129"), val = tensor(-1)]; tensor x_13_interleave_0 = const()[name = tensor("x_13_interleave_0"), val = tensor(false)]; tensor embedding_to_fp16_dtype_0 = const()[name = tensor("embedding_to_fp16_dtype_0"), val = tensor("fp16")]; tensor embedding_to_fp16 = cast(dtype = embedding_to_fp16_dtype_0, x = embedding)[name = tensor("cast_24")]; tensor x_13_cast_fp16 = concat(axis = var_129, interleave = x_13_interleave_0, values = (var_127_cast_fp16, embedding_to_fp16))[name = tensor("x_13_cast_fp16")]; tensor var_132_axes_0 = const()[name = tensor("op_132_axes_0"), val = tensor([1])]; tensor var_132_cast_fp16 = expand_dims(axes = var_132_axes_0, x = mapping_1_cast_fp16)[name = tensor("op_132_cast_fp16")]; tensor mapping_reps_0 = const()[name = tensor("mapping_reps_0"), val = tensor([1, 512, 1])]; tensor mapping_cast_fp16 = tile(reps = mapping_reps_0, x = var_132_cast_fp16)[name = tensor("mapping_cast_fp16")]; tensor x_15_cast_fp16 = add(x = x_13_cast_fp16, y = mapping_cast_fp16)[name = tensor("x_15_cast_fp16")]; tensor var_153 = const()[name = tensor("op_153"), val = tensor(-1)]; tensor transformer_blocks_0_attention_norm_fc_weight_to_fp16 = const()[name = tensor("transformer_blocks_0_attention_norm_fc_weight_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(5254016)))]; tensor transformer_blocks_0_attention_norm_fc_bias_to_fp16 = const()[name = tensor("transformer_blocks_0_attention_norm_fc_bias_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(6302656)))]; tensor linear_4_cast_fp16 = linear(bias = transformer_blocks_0_attention_norm_fc_bias_to_fp16, weight = transformer_blocks_0_attention_norm_fc_weight_to_fp16, x = features_to_fp16)[name = tensor("linear_4_cast_fp16")]; tensor var_172 = const()[name = tensor("op_172"), val = tensor([1, 2048, 1])]; tensor h_3_cast_fp16 = reshape(shape = var_172, x = linear_4_cast_fp16)[name = tensor("h_3_cast_fp16")]; tensor var_174_split_sizes_0 = const()[name = tensor("op_174_split_sizes_0"), val = tensor([1024, 1024])]; tensor var_174_axis_0 = const()[name = tensor("op_174_axis_0"), val = tensor(1)]; tensor var_174_cast_fp16_0, tensor var_174_cast_fp16_1 = split(axis = var_174_axis_0, split_sizes = var_174_split_sizes_0, x = h_3_cast_fp16)[name = tensor("op_174_cast_fp16")]; tensor gamma_3_perm_0 = const()[name = tensor("gamma_3_perm_0"), val = tensor([0, -1, 1])]; tensor beta_3_perm_0 = const()[name = tensor("beta_3_perm_0"), val = tensor([0, -1, 1])]; tensor x_19_axes_0 = const()[name = tensor("x_19_axes_0"), val = tensor([-1])]; tensor var_146_to_fp16 = const()[name = tensor("op_146_to_fp16"), val = tensor(0x1.5p-17)]; tensor x_19_cast_fp16 = layer_norm(axes = x_19_axes_0, epsilon = var_146_to_fp16, x = x_15_cast_fp16)[name = tensor("x_19_cast_fp16")]; tensor var_180_promoted_to_fp16 = const()[name = tensor("op_180_promoted_to_fp16"), val = tensor(0x1p+0)]; tensor gamma_3_cast_fp16 = transpose(perm = gamma_3_perm_0, x = var_174_cast_fp16_0)[name = tensor("transpose_40")]; tensor var_181_cast_fp16 = add(x = gamma_3_cast_fp16, y = var_180_promoted_to_fp16)[name = tensor("op_181_cast_fp16")]; tensor var_182_cast_fp16 = mul(x = var_181_cast_fp16, y = x_19_cast_fp16)[name = tensor("op_182_cast_fp16")]; tensor beta_3_cast_fp16 = transpose(perm = beta_3_perm_0, x = var_174_cast_fp16_1)[name = tensor("transpose_39")]; tensor x_21_cast_fp16 = add(x = var_182_cast_fp16, y = beta_3_cast_fp16)[name = tensor("x_21_cast_fp16")]; tensor transformer_blocks_0_attention_norm_context_fc_weight_to_fp16 = const()[name = tensor("transformer_blocks_0_attention_norm_context_fc_weight_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(6306816)))]; tensor transformer_blocks_0_attention_norm_context_fc_bias_to_fp16 = const()[name = tensor("transformer_blocks_0_attention_norm_context_fc_bias_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(7355456)))]; tensor linear_5_cast_fp16 = linear(bias = transformer_blocks_0_attention_norm_context_fc_bias_to_fp16, weight = transformer_blocks_0_attention_norm_context_fc_weight_to_fp16, x = features_to_fp16)[name = tensor("linear_5_cast_fp16")]; tensor var_194 = const()[name = tensor("op_194"), val = tensor([1, 2048, 1])]; tensor h_7_cast_fp16 = reshape(shape = var_194, x = linear_5_cast_fp16)[name = tensor("h_7_cast_fp16")]; tensor var_196_split_sizes_0 = const()[name = tensor("op_196_split_sizes_0"), val = tensor([1024, 1024])]; tensor var_196_axis_0 = const()[name = tensor("op_196_axis_0"), val = tensor(1)]; tensor var_196_cast_fp16_0, tensor var_196_cast_fp16_1 = split(axis = var_196_axis_0, split_sizes = var_196_split_sizes_0, x = h_7_cast_fp16)[name = tensor("op_196_cast_fp16")]; tensor gamma_7_perm_0 = const()[name = tensor("gamma_7_perm_0"), val = tensor([0, -1, 1])]; tensor beta_7_perm_0 = const()[name = tensor("beta_7_perm_0"), val = tensor([0, -1, 1])]; tensor var_202_promoted_to_fp16 = const()[name = tensor("op_202_promoted_to_fp16"), val = tensor(0x1p+0)]; tensor gamma_7_cast_fp16 = transpose(perm = gamma_7_perm_0, x = var_196_cast_fp16_0)[name = tensor("transpose_38")]; tensor var_203_cast_fp16 = add(x = gamma_7_cast_fp16, y = var_202_promoted_to_fp16)[name = tensor("op_203_cast_fp16")]; tensor var_204_cast_fp16 = mul(x = var_203_cast_fp16, y = x_19_cast_fp16)[name = tensor("op_204_cast_fp16")]; tensor beta_7_cast_fp16 = transpose(perm = beta_7_perm_0, x = var_196_cast_fp16_1)[name = tensor("transpose_37")]; tensor x_27_cast_fp16 = add(x = var_204_cast_fp16, y = beta_7_cast_fp16)[name = tensor("x_27_cast_fp16")]; tensor transformer_blocks_0_attention_to_q_weight_to_fp16 = const()[name = tensor("transformer_blocks_0_attention_to_q_weight_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(7359616)))]; tensor linear_6_bias_0_to_fp16 = const()[name = tensor("linear_6_bias_0_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(8408256)))]; tensor linear_6_cast_fp16 = linear(bias = linear_6_bias_0_to_fp16, weight = transformer_blocks_0_attention_to_q_weight_to_fp16, x = x_21_cast_fp16)[name = tensor("linear_6_cast_fp16")]; tensor transformer_blocks_0_attention_to_kv_weight_to_fp16 = const()[name = tensor("transformer_blocks_0_attention_to_kv_weight_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(8409344)))]; tensor linear_7_bias_0_to_fp16 = const()[name = tensor("linear_7_bias_0_to_fp16"), val = tensor(BLOBFILE(path = tensor("@model_path/weights/weight.bin"), offset = tensor(10506560)))]; tensor linear_7_cast_fp16 = linear(bias = linear_7_bias_0_to_fp16, weight = transformer_blocks_0_attention_to_kv_weight_to_fp16, x = x_27_cast_fp16)[name = tensor("linear_7_cast_fp16")]; tensor var_212_split_sizes_0 = const()[name = tensor("op_212_split_sizes_0"), val = tensor([512, 512])]; tensor var_212_axis_0 = const()[name = tensor("op_212_axis_0"), val = tensor(-1)]; tensor var_212_cast_fp16_0, tensor var_212_cast_fp16_1 = split(axis = var_212_axis_0, split_sizes = var_212_split_sizes_0, x = linear_7_cast_fp16)[name = tensor("op_212_cast_fp16")]; tensor var_221 = const()[name = tensor("op_221"), val = tensor([1, 512, 8, 64])]; tensor x_31_cast_fp16 = reshape(shape = var_221, x = linear_6_cast_fp16)[name = tensor("x_31_cast_fp16")]; tensor var_231 = const()[name = tensor("op_231"), val = tensor([1, 512, 8, 64])]; tensor x_35_cast_fp16 = reshape(shape = var_231, x = var_212_cast_fp16_0)[name = tensor("x_35_cast_fp16")]; tensor var_241 = const()[name = tensor("op_241"), val = tensor([1, 512, 8, 64])]; tensor x_39_cast_fp16 = reshape(shape = var_241, x = var_212_cast_fp16_1)[name = tensor("x_39_cast_fp16")]; tensor var_243 = const()[name = tensor("op_243"), val = tensor([0, 2, 1, 3])]; tensor sim_1_transpose_x_0 = const()[name = tensor("sim_1_transpose_x_0"), val = tensor(false)]; tensor sim_1_transpose_y_0 = const()[name = tensor("sim_1_transpose_y_0"), val = tensor(false)]; tensor transpose_9_perm_0 = const()[name = tensor("transpose_9_perm_0"), val = tensor([0, 2, -3, -1])]; tensor transpose_10_perm_0 = const()[name = tensor("transpose_10_perm_0"), val = tensor([0, 2, -1, -3])]; tensor transpose_10 = transpose(perm = transpose_10_perm_0, x = x_35_cast_fp16)[name = tensor("transpose_34")]; tensor transpose_9 = transpose(perm = transpose_9_perm_0, x = x_31_cast_fp16)[name = tensor("transpose_35")]; tensor sim_1_cast_fp16 = matmul(transpose_x = sim_1_transpose_x_0, transpose_y = sim_1_transpose_y_0, x = transpose_9, y = transpose_10)[name = tensor("sim_1_cast_fp16")]; tensor var_247_to_fp16 = const()[name = tensor("op_247_to_fp16"), val = tensor(0x1p-3)]; tensor sim_3_cast_fp16 = mul(x = sim_1_cast_fp16, y = var_247_to_fp16)[name = tensor("sim_3_cast_fp16")]; tensor attn_1_cast_fp16 = softmax(axis = var_153, x = sim_3_cast_fp16)[name = tensor("attn_1_cast_fp16")]; tensor x_41_transpose_x_0 = const()[name = tensor("x_41_transpose_x_0"), val = tensor(false)]; tensor