普通に使ってると真っ先にDatastore Read Operationsに引っかかるので、それに目が生きがちですが、標準設定で一番課金額を食うのは、実はFrontend Idle Instancesなんですね。
少なくとも1インスタンスにつき15分相当の金額を取られるので、Instancesの増減を減らす方が、最初は必要でしょう。
それに、どうやらmemcacheが効くのはインスタンス単位らしいのです。故に、各インスタンスがばらばらにキャッシュする上に、都合よく分散しないみたいなので、特定のインスタンスのキャッシュが毎回忘れてるとかになりかねません。
Idle InstancesをAutomatic-1にしちゃったので、Pending Latencyのルールが今ひとつ判らないままですが、課金額は$1未満まで落ち着きました。

この中でmemcacheの効果はどれほどかはちょっと判らないですね。もう一度offにして様子を見るしかなさそうです。問題のRead Operationsが$0になったことは残念ながら一度もないので。
参考までに筆者のケースは
- 初日 $1.70
- 2日目 $1.33 あちこちmemcacheを使用&途中からIdle Instancesを最大2に設定
- Frontend InstancesのBillable Used Hoursが31.92で、$1.28。
- 3日め $0.60 Idle Instancesを、最大1に設定
- Frontend InstancesのBillable Used Hoursが13.06で、$0.53。
- limitが小さいのはDatastore Read Operationsで、
- memcacheにキャッシュするしかない
- 上昇が早いのはFrontend Instances Hours
- Perfomance設定のIdle Instancesを減らすしかない