Final Results

105 views
Skip to first unread message

semeval-2026-task-1-humor-gen

unread,
Feb 22, 2026, 4:51:24 PM (9 days ago) Feb 22
to semeval-2026-task-1-humor-gen
Here are the results of the Eval phase.

The results are computed in the same way as in the Eval Trial phase.

Subtask A in English:

Rank  System            Rating  (95% CI)
----------------------------------------
   1  baseline          1081    [1045, 1110]
   1  SLPG_FJWU_Insa    1080    [1046, 1120]
   1  berkbubus         1079    [1057, 1115]
   1  jct_sb            1063    [1036, 1099]
   1  jjuliar           1060    [1027, 1091]
   1  mrshu             1045    [1018, 1073]
   1  lmfaoooo          1041    [1009, 1064]
   1  begumyivli        1041    [1008, 1068]
   1  oseminck          1034    [1005, 1072]
   2  t_abbasi7         1029    [1001, 1053]
   2  sinaeskandari     1022    [ 989, 1054]
   2  abdulmj1          1020    [ 992, 1053]
   3  arampageos        1019    [ 984, 1045]
   2  stefanoprea       1012    [ 986, 1051]
   4  zhangxulong       1012    [ 985, 1036]
   4  abaruah           1009    [ 979, 1041]
   4  lu_rui            1008    [ 982, 1038]
   4  j10official       1005    [ 969, 1042]
   5  ar01989           1003    [ 971, 1035]
   6  polarizedteam      999    [ 968, 1022]
   6  luttt              998    [ 975, 1025]
   6  mdehouck           991    [ 963, 1026]
   6  aba_team           991    [ 958, 1025]
  11  clashing           966    [ 945,  993]
  13  tanlocn            962    [ 926,  986]
  18  jayicodes          950    [ 920,  977]
  16  wangkongqiang      950    [ 922,  982]
  17  dangnt             946    [ 913,  979]
  23  ahoblitz           929    [ 903,  960]
  24  soyliz30           928    [ 903,  950]
  28  yasaminal          885    [ 855,  915]
  31  hemeshkumar_31     843    [ 802,  875]


Subtask A in Spanish:

Rank  System            Rating  (95% CI)
----------------------------------------
   1  mrshu             1182    [1143, 1222]
   1  baseline          1140    [1098, 1177]
   2  zhangxulong       1093    [1060, 1129]
   2  lmfaoooo          1091    [1053, 1121]
   2  stefanoprea       1087    [1062, 1128]
   2  berkbubus         1070    [1024, 1109]
   3  arampageos        1048    [1020, 1093]
   6  j10official       1015    [ 985, 1049]
   8  t_abbasi7          985    [ 941, 1012]
   8  luttt              960    [ 927,  994]
   9  lu_rui             953    [ 912,  984]
   9  ahoblitz           927    [ 894,  968]
  10  yasaminal          908    [ 868,  937]
  10  ar01989            889    [ 854,  929]
  12  soyliz30           864    [ 827,  907]
  16  clashing           787    [ 753,  823]


Subtask A in Chinese:

Rank  System            Rating  (95% CI)
----------------------------------------
   1  xxl_6699          1120    [1085, 1164]
   1  lmfaoooo          1081    [1031, 1127]
   1  arampageos        1059    [1018, 1091]
   1  xxl2233           1057    [1015, 1100]
   1  wangkongqiang     1054    [1024, 1104]
   1  baseline          1053    [1003, 1090]
   1  shenwutao         1052    [1009, 1094]
   1  mrshu             1045    [1004, 1090]
   2  lu_rui            1018    [ 980, 1052]
   2  j10official       1016    [ 966, 1063]
   2  zhangxulong       1013    [ 971, 1061]
   2  stefanoprea       1009    [ 967, 1049]
   2  hugang11           991    [ 958, 1036]
   2  ahoblitz           988    [ 945, 1033]
   5  luttt              981    [ 928, 1017]
   6  berkbubus          971    [ 939, 1014]
  14  deepgpt            903    [ 868,  946]
  16  t_abbasi7          888    [ 845,  933]
  17  clashing           860    [ 808,  899]
  17  yasaminal          840    [ 791,  879]


Subtask B1:

Rank  System            Rating  (95% CI)
----------------------------------------
   1  praveenjoshi007   1140    [1099, 1180]
   1  baseline          1124    [1084, 1164]
   1  warda_yousaf      1077    [1043, 1110]
   3  t_abbasi7         1047    [1012, 1079]
   4  j10official        994    [ 966, 1030]
   5  wangkongqiang      976    [ 941, 1007]
   4  abaruah            973    [ 938, 1018]
   5  ahoblitz           949    [ 921,  983]
   7  xxl_6699           915    [ 879,  939]
   6  aba_team           913    [ 877,  950]
   8  stefanoprea        891    [ 856,  924]


Subtask B2:

Rank  System            Rating  (95% CI)
----------------------------------------
   1  xxl_6699          1065    [1032, 1102]
   1  praveenjoshi007   1057    [1020, 1104]
   1  t_abbasi7         1035    [1006, 1069]
   1  baseline          1022    [ 991, 1060]
   1  stefanoprea       1012    [ 982, 1048]
   2  j10official        993    [ 960, 1026]
   3  wangkongqiang      987    [ 948, 1016]
   4  aba_team           959    [ 919, 1004]
   5  ahoblitz           957    [ 911,  989]
   7  abaruah            914    [ 870,  950]

Reply all
Reply to author
Forward
0 new messages