正規表現にマッチしないものの削除

Excelから書き出されたデータの変換なんかを多くやっていると、特定パターンの置き換えよりもむしろ特定パターンにマッチしない部分の置き換えの方が欲しくなってくる。例えばtable関係のタグは残しつつ、内包するデータに付随した余分な装飾タグは省きたいときとか。
今日の業務は膨大なExcelデータから特定パターンの文字列のみを取り出す作業。数字3桁-数字1桁-記号1字にマッチするパターンを書くのは簡単だが、それ以外を削除するのは難しい。
いっそ置換スクリプト書いて、パターンマッチした部分だけ配列に格納して書き直した方が簡単に思えてきた。